Денис Аветисян — Страница 322

Эмоциональные волны в сети: возможности и пределы цифрового моделирования

27.12.2025 от Денис Аветисян

Новое исследование анализирует, насколько точно современные языковые модели могут воспроизводить распространение эмоций в социальных сетях и выявляет ключевые ограничения.

UniRec-0.1B: Распознавание текста и формул стало проще

27.12.2025 от Денис Аветисян

В ходе анализа страниц, содержащих смешанный текст и формальные выражения, модели PaddleOCR-VL и MinerU2.5 ошибочно классифицируют обычный текст, встроенный в математические формулы, как сами формулы, в то время как UniRec-0.1B демонстрирует способность корректно идентифицировать его как текстовую информацию.

Новая модель UniRec-0.1B с 0,1 миллиарда параметров объединяет распознавание текста и математических формул, обеспечивая высокую точность и скорость работы.

Щит от взлома: Защита систем распознавания действий человека на базе ИИ

27.12.2025 от Денис Аветисян

В исследовании сравнивалась эффективность AegisAgent с тремя базовыми подходами к защите - текстовой, классической HAR-защитой и мультимодальным обнаружением - по таким показателям, как DA, RR и ASR, демонстрируя возможность повышения надежности систем защиты.

Новая система AegisAgent автоматически противодействует атакам, направленным на манипулирование ИИ, анализирующим поведение людей.

Поиск с умом: как адаптировать текстовые представления для онлайн-барахолок

27.12.2025 от Денис Аветисян

Архитектура для проведения A/B-тестирования предусматривает идентичные компоненты для контрольной и тестовой групп, различающиеся исключительно используемой моделью эмбеддингов, маршрутизируемой через Triton, что позволяет оценить влияние различных моделей на конечный результат, при этом поток данных отражается сплошными линиями, а взаимодействие между сервисами - пунктирными.

Новый подход к обучению текстовых представлений позволяет значительно улучшить качество поиска и увеличить доход на площадках онлайн-обмена, ориентированных на японский рынок.

Избавляем нейросети от лишних знаний: методы редактирования моделей

27.12.2025 от Денис Аветисян

Формат контекста, предоставляемого для редактирования в IKE (zheng-etal-2023-edit), определяет структуру информации, используемой системой для внесения изменений.

Новое исследование рассматривает, как можно целенаправленно удалять информацию из больших языковых моделей, не переобучая их целиком.

Самообучение с обратной связью: новый подход к анализу биологических последовательностей

27.12.2025 от Денис Аветисян

Внедрение ошибок и обучение с отражением позволяют усилить способность к рассуждению в биопоследовательных моделях.

Исследователи разработали метод предварительного обучения, позволяющий моделям биологических последовательностей самостоятельно выявлять и исправлять ошибки в процессе анализа.

Суть Рассуждений: Как Ускорить Обучение Больших Моделей

27.12.2025 от Денис Аветисян

Распределение количества токенов в выборке из 8000 обучающих примеров набора данных Bespoke-Stratos-17k демонстрирует различия в длине запросов, цепочек рассуждений, ответов и полных последовательностей, что позволяет оценить сложность и информативность каждого компонента при генерации текста.

Новое исследование показывает, что для передачи навыков логического мышления от больших языковых моделей достаточно анализировать лишь начальные этапы процесса рассуждения.

Искусственный интеллект на службе онкологии: новый взгляд на прогноз лечения рака легких

27.12.2025 от Денис Аветисян

Новое исследование показывает, как современные алгоритмы обработки языка могут значительно повысить точность прогнозирования эффективности терапии рака легких.

Гибкая адаптация моделей «зрение-язык» для мобильных устройств

27.12.2025 от Денис Аветисян

$Иерархическая оптимизация рангов и динамическая адаптация в HyDRA позволяют эффективно настроить мобильные визуально-языковые модели (VLM) посредством обучения с подкреплением, где [latex]X_{t}[/latex] и [latex]X_{v}[/latex] обозначают текстовые и визуальные токены соответственно, а ранги, такие как [latex]R^{Up}[/latex], [latex]R^{Q}[/latex], [latex]R^{K}[/latex] и [latex]R^{Gate}[/latex], регулируют проецирование в полносвязных сетях.$

Новый подход HyDRA позволяет эффективно настраивать модели, объединяющие зрение и язык, для работы на мобильных платформах, не увеличивая количество обучаемых параметров.

Нейросети: баланс скорости и надёжности

27.12.2025 от Денис Аветисян

Тепловые карты демонстрируют корреляцию между слоями вывода и верификации, подтверждая обоснованность предположения о стабильности траектории и позволяя оценить его влияние на точность вычислений, что подчеркивает взаимосвязь между внутренней структурой модели и надежностью её результатов.

Новый подход к формальной верификации глубоких нейронных сетей с использованием ранних выходов позволяет повысить эффективность проверки, не жертвуя безопасностью.