Малые модели – большая опасность: новые угрозы от доступного ИИ

Симуляционное исследование вычислительных ресурсов, необходимых для осуществления атак с использованием моделей искусственного интеллекта с низкой вычислительной нагрузкой - дезинформации, фишинга, клонирования голоса и дипфейков - показывает, что для генерации изображений, текста и аудио требуется определенная скорость памяти и вычислительная мощность, границы которых, отображенные в виде 5-го и 95-го процентилей, позволяют оценить требуемые ресурсы, при этом производительность чипов NVIDIA V100 и Apple M2 Ultra служит ориентиром для устройств, не подпадающих под экспортный контроль.

Уменьшение размеров и повышение эффективности языковых моделей, в сочетании с доступностью вычислительных ресурсов, создают растущие риски, поскольку даже недорогое оборудование позволяет развертывать потенциально вредоносные кампании на основе ИИ.

Разумный агент: Новая модель оценки действий для веб-навигации

Система WebArbiter, используя историю взаимодействий и текущие наблюдения, сравнивает варианты действий, применяя принципы, полученные из более мощной языковой модели, и обучается с подкреплением на основе проверяемых вознаграждений [latex]R\in\{-1,+1}[/latex], формируя структурированные обоснования и вынося окончательный вердикт, позволяя ей, в процессе работы, выводить принципы оценки и выбирать действие, наиболее эффективно приближающее к завершению задачи.

Исследователи представили WebArbiter — систему, которая помогает веб-агентам принимать более обоснованные решения, оценивая их действия на основе принципов логического мышления.

Зрение и Глубокий Анализ: Новая Эра Интеллектуальных Систем

Разработан комплексный конвейер глубокого синтеза мультимодальных исследований, использующий возможности большой мультимодальной языковой модели и текстовой языковой модели, что позволяет генерировать траектории с горизонтом планирования и с использованием множества инструментов, а для их синтеза и обучения с подкреплением применяются высококачественные фактические экземпляры вопросов-ответов, полученные в результате строгой верификации и обфускации.

Исследователи представили инновационный подход к обучению мультимодальных моделей, позволяющий им самостоятельно проводить глубокий анализ визуальной информации и отвечать на сложные вопросы.

Адаптивная точность: Новый подход к ускорению больших языковых моделей

Эффективность вычислений GPT-2 XL в смешанной точности демонстрирует зависимость производительности от количества битов мантиссы μ и порога оценки соответствия ключей-запросов τ на различных наборах данных: OpenWebText, CodeParrot и ArXiv.

Исследователи предложили инновационную стратегию адаптивного вычисления, позволяющую повысить стабильность и эффективность работы нейронных сетей-трансформеров.

Визуальный интеллект: как данные, а не размер модели, открывают путь к рассуждениям

Новое исследование показывает, что для развития способностей к сложным визуальным рассуждениям ключевым фактором является качество и структура обучающих данных, а не просто увеличение масштаба нейронных сетей.

Скрытые инструкции: Как «любопытные» агенты раскрывают секреты больших языковых моделей

Несмотря на лексические различия, извлечение семантики посредством JustAsk и непосредственная декомпиляция npm-пакета (Piebald AI, 2026) демонстрируют идентичную операционную семантику с коэффициентом семантической близости 0.94, подтверждая, что верификация на основе согласованности действительно позволяет достоверно установить содержание системных промптов.

Новое исследование показывает, что внутренние инструкции, управляющие поведением современных ИИ, могут быть извлечены с помощью автоматизированных методов, открывая потенциальные уязвимости в безопасности.

Ускорение решения задач MIP: параллельные алгоритмы для линейного программирования

Новый подход к параллельному решению линейных программ на графических процессорах позволяет значительно ускорить ключевые этапы алгоритмов решения задач целочисленного программирования.

Обучение без слов: Как ИИ осваивает новое, не пробуя

Исследование демонстрирует, что языковые модели способны приобретать навыки напрямую, как в случае с решением головоломки Sokoban-Box2, где наблюдается быстрая сходимость (от 0.0 до 0.45), или косвенно, накапливая знания, которые впоследствии активируются на этапе развития, что подтверждается результатами по Sudoku - начальный уровень 0.0, затем 0.29 и, наконец, достижение 0.97.

Новый подход позволяет агентам искусственного интеллекта эффективно исследовать окружение и быстро адаптироваться к новым задачам, минимизируя необходимость в случайных проб и ошибок.

БиоАгент: Проверка ИИ на прочность в мире геномики

Предлагаемая методология BioAgent Bench оценивает возможности больших языковых моделей в решении биоинформатических задач, используя в качестве входных данных как исходные данные, так и эталонные, а также стресс-тестирование с помощью различных возмущений, охватывая десять задач, сфокусированных на различных организмах, вирусах и экосистемах, и десять моделей - пять с открытым и пять с закрытым исходным кодом - для всесторонней оценки их производительности.

Новый набор инструментов позволяет оценить, насколько хорошо искусственный интеллект справляется со сложными задачами биоинформатики, от анализа данных до автоматизации научных рабочих процессов.