От основ к интеллекту: как объединить машинное обучение и большие языковые модели

В статье представлена структура двухчастного курса, призванного обеспечить студентам прочную базу в машинном обучении и познакомить их с передовыми технологиями больших языковых моделей.

Наука на виду: Новый тест для искусственного интеллекта

Набор данных PRiSM содержит параметризованные вопросы с подставленными входными значениями, сгенерированные на их основе изображения, пошаговые решения и соответствующий код на языке Python, что позволяет комплексно оценивать способность систем к решению задач и генерации программного кода.

Исследователи представили PRiSM — сложный мультимодальный бенчмарк, призванный проверить способность моделей искусственного интеллекта к научному мышлению и решению задач.

Один шаг к идеальному изображению: Новый подход к генеративным моделям

В ходе анализа архитектуры TwinFlow посредством абляционных исследований на наборе данных Qwen-Image-TwinFlow, установлено, что модификации в структуре модели оказывают существенное влияние на конечные результаты, что демонстрирует зависимость производительности от конкретной конфигурации.

Исследователи представили TwinFlow — метод, позволяющий создавать высококачественные изображения всего за один или два шага, значительно ускоряя процесс генерации.

Искусственный интеллект и поэзия: как «распаковать» его риторику

Новое исследование показывает, как использование поэтических запросов позволяет выявить скрытые предубеждения и творческие ограничения больших языковых моделей.

Управление Формой: Новый Метод Контроля 3D-Генерации

Пространственное управление позволяет создавать сложные трёхмерные модели из простых геометрических примитивов, таких как суперквадрики, и редактировать их с высокой точностью - от изменения спинки стула и добавления подлокотников до детальной настройки размеров дивана и расположения подушек, демонстрируя возможность быстрого создания высококачественных ассетов на основе эскизов и текстовых запросов.

Исследователи представили способ манипулировать 3D-объектами, генерируемыми нейросетями, непосредственно в процессе генерации, без необходимости переобучения модели.

Искусственный интеллект на службе виртуальных испытаний

Новое исследование показывает, как генеративный ИИ может изменить процессы тестирования сложных киберфизических систем, но и выявляет ключевые проблемы, требующие решения.

Предел возможностей: Почему настоящий Искусственный Интеллект невозможен

Новое исследование демонстрирует, что создание Искусственного Общего Интеллекта (ИОИ), способного к подлинному творчеству и выходу за рамки алгоритмов, принципиально невозможно.

Искусственный судья: Как обучить модель понимать изображения и текст без участия человека

В рамках исследования разрабатывается итеративный процесс совершенствования модели-судьи для оценки ответов, включающий генерацию пар предпочтений на основе синтетических данных: для задач с открытым пространством решений создаются оригинальные ответы с намеренно внесёнными ошибками, а для задач с закрытым пространством решений - сопоставление наиболее часто встречающегося ответа со случайной альтернативой, после чего модель обучается на отфильтрованных данных, основанных на этих предпочтениях, что позволяет последовательно улучшать её способность к оценке.

Новое исследование предлагает метод автоматического обучения моделей оценки мультимодальных данных, избавляя от необходимости дорогостоящей ручной разметки.

Многоязычны ли современные нейросети на самом деле?

Точность различных больших языковых моделей, включая OpenLLaMA (3B и 7B), Mistral 7B, Mixtral 8x7B и Qwen2.5 (3B и 7B), сравнивается с точностью регулярных выражений, демонстрируя вариативность в эффективности различных архитектур при решении задач, требующих сопоставления с образцом.

Новое исследование показывает, что использование больших языковых моделей для извлечения медицинской информации на итальянском языке может быть не таким эффективным, как традиционные методы.