Uni-MMMU: Предел масштабируемости мультимодального рассуждения.

Автор: Денис Аветисян Все давно устали от того, что искусственный интеллект, умеющий видеть и понимать язык, часто оказывается просто красивой оберткой без реального взаимопонимания между этими двумя модальностями. Кажется, мы научили машины различать картинки и читать тексты, но они по-прежнему не умеют думать вместе с ними. И вот, когда мы уже почти смирились с тем, … Читать далее

ХроноGPT-Instruct: Устранение предвзятости «взгляда в будущее» в языковых моделях.

Автор: Денис Аветисян В эпоху стремительного развития генеративных моделей искусственного интеллекта, особенно в сфере финансовых прогнозов, возникает парадоксальная проблема: как обеспечить достоверность предсказаний, когда сами модели обучаются на данных, содержащих информацию о будущем? В работе «Chronologically Consistent Generative AI» авторы осмеливаются исследовать эту фундаментальную дилемму, демонстрируя, что кажущаяся безобидная «утечка» информации из будущего может значительно … Читать далее

ИИ трейдинг: когда новости бьют по техническим индикаторам, а обучение с подкреплением пытается удержаться на ногах.

Автор: Денис Аветисян Все давно знают: рынок эффективен, а попытки постоянно превзойти его — это, мягко говоря, утопия. Десятилетия исследований и сложнейшие алгоритмы лишь подтверждают эту закономерность. Но что, если все эти модели строятся на устаревших данных и игнорируют океан информации, скрытый в новостных лентах и социальных сетях? Именно здесь, когда мы уже почти смирились … Читать далее

Шёпот сети: как DeepMMSearch-R1 выудил истину из хаоса веб-поиска.

Автор: Денис Аветисян На протяжении долгого времени, мультимодальные большие языковые модели (MLLM) испытывали трудности с ответами на вопросы, требующие доступа к внешним знаниям, полагаясь скорее на запоминание, чем на рассуждения, и часто проваливаясь в ситуациях, выходящих за рамки их первоначального обучения. Новая работа, представленная в «DeepMMSearch-R1: Empowering Multimodal LLMs in Multimodal Web Search», предлагает прорыв … Читать далее

Игры в коалиции: где стабильность распадается на части.

Автор: Денис Аветисян Издревле стояла задача справедливого разделения ресурсов и формирования коалиций, где каждый участник стремится к оптимальному союзу, однако учет реальных ограничений – будь то минимальный или максимальный размер группы – долгое время оставался узким местом в теории игр. Настоящая работа, в которой представлен анализ “Single-Deviation Stability in Additively Separable Hedonic Games with Constrained … Читать далее

Опера́нд Квант: Один в поле — воин AutoML?

Обзор статьи «Operand Quant: A Single-Agent Architecture for Autonomous Machine Learning Engineering» Автор: Денис Аветисян Автономный Инженер: Новый Взгляд на AutoMLE Автоматизированное машинное обучение (AutoMLE) — заманчивая перспектива, обещающая демократизацию разработки искусственного интеллекта. Но за красивыми словами скрывается суровая реальность: истинная автономия — цель, до которой ещё предстоит дотянуться. Текущие подходы часто опираются на хрупкие … Читать далее

Меньше – значит глубже: рекурсивные сети в эпоху минимализма.

Обзор статьи «Less is More: Recursive Reasoning with Tiny Networks» Автор: Денис Аветисян Рекурсивное Рассуждение: Новая Парадигма Искусственного Интеллекта Современные модели искусственного интеллекта, несмотря на впечатляющие достижения, часто оказываются неспособными к решению задач, требующих итеративного уточнения и глубокого рассуждения. Они подобны тщательно выстроенным механизмам, неспособным к самокоррекции и адаптации к меняющимся условиям. Это обусловлено, в … Читать далее

Шёпот языков: как дрессировать цифрового голема для забытых наречий.

Обзор статьи «Multilingual Routing in Mixture-of-Experts» Автор: Денис Аветисян Данные – это рой мотыльков, каждая цифра – взмах крыла, способный вызвать бурю не там, где ожидаешь. Обычно я смотрю на эти модели как на цифровых големов, которых кормят случайными числами, надеясь, что они начнут складывать что-то осмысленное. Все эти разговоры о “универсальных лингвистических представлениях” – … Читать далее

Эмоциональный отпечаток: Как мы научили ИИ читать душу (и почему рейтинги вам врут)

Автор: Денис Аветисян От автора: Прежде чем мы окунемся в мир патологических лжецов и эмпатичных машин, позвольте мне в двух словах рассказать, о чем эта история. Это хроника одного амбициозного эксперимента: мы решили научить машину понимать не слова, а эмоции. Для этого мы создали сложную систему с целой «коллегией» AI-экспертов, которая умела читать уникальные «эмоциональные отпечатки» … Читать далее

Почему ваш Steam — патологический лжец, и как мы научили компьютер читать между строк

Автор: Денис Аветисян Вступление: Иголка, стог сена и общий знаменатель. Что общего у акции никому не известной биотех-компании и инди-игры про пиксельного рыцаря, которую вчера вечером выложили в Steam? На первый взгляд — ничего. А на самом деле — всё. И то, и другое — это иголка в гигантском, постоянно растущем стоге сена из информационного … Читать далее