Искусственный интеллект — Страница 85

Управление Экспертами: Новый Подход к Точной Настройке Больших Языковых Моделей

12.03.2026 от Денис Аветисян

Процедура тонкой настройки предложенного метода ReMix позволяет оптимизировать модель для достижения требуемой производительности, используя итеративный процесс адаптации параметров.

Исследователи предлагают метод динамического распределения весов между различными адаптерами, что позволяет добиться большей выразительности и стабильности при обучении больших языковых моделей.

Искусственный интеллект: новый импульс для разработки программного обеспечения

12.03.2026 от Денис Аветисян

В статье исследуется, как технологии искусственного интеллекта преобразуют процессы разработки, повышая гибкость и эффективность команд.

Обучение с контрастом: новый подход к усилению логических способностей языковых моделей

12.03.2026 от Денис Аветисян

$В рамках предложенной схемы CLIPO, для каждого входного запроса [latex]{\bm{x}}[/latex] методы оптимизации политики генерируют набор траекторий [latex]{\{{\bm{y}}\_{1},{\bm{y}}\_{2},\dots,{\bm{y}}\_{G}\}}[/latex], для которых рассчитываются соответствующие награды обучения с подкреплением [latex]{\{r\_{1},r\_{2},\dots,r\_{G}\}}[/latex], после чего, на основе последних скрытых состояний [latex]{\{{\bm{h}}\_{1},{\bm{h}}\_{2},\dots,{\bm{h}}\_{G}\}}[/latex] этих траекторий, вычисляются семантические вложения на уровне траекторий [latex]{\{{\bm{e}}\_{1},{\bm{e}}\_{2},\dots,{\bm{e}}\_{G}\}}[/latex] с помощью контрастивного механизма, позволяющего оценить сходство успешных и неудачных траекторий посредством контрастивных наград [latex]{\{r\_{1}^{\text{CL}},r\_{2}^{\text{CL}},\dots,r\_{G}^{\text{CL}}\}}[/latex] и, в конечном итоге, сформировать итоговую награду [latex]{r^{\prime}\_{i}=r\_{i}+r^{\text{CL}}\_{i}}[/latex] для каждой траектории.$

Исследователи предлагают метод CLIPO, использующий контрастное обучение для выравнивания успешных траекторий рассуждений, что значительно повышает обобщающую способность и надежность систем искусственного интеллекта.

Интеллектуальный поиск в океане «омикс» данных

12.03.2026 от Денис Аветисян

Агентная система осуществляет извлечение данных из научных статей и последующее структурирование этих данных в базе, позволяя эффективно анализировать и использовать информацию, содержащуюся в публикациях.

Новая система автоматизирует обнаружение и структурирование результатов «омикс» исследований, открывая возможности для повторного использования и комплексного анализа.

Искусственный интеллект как стратег: генерация игровых политик с помощью языковых моделей

12.03.2026 от Денис Аветисян

В ходе многократных игр в

Новый подход позволяет создавать интерпретируемые стратегии для многоагентных систем, используя возможности больших языковых моделей и принципы теории игр.

Грань между ИИ: Как отделить модель от системы

12.03.2026 от Денис Аветисян

Рассмотрение концептуальных подходов к определениям «модели искусственного интеллекта» и «системы искусственного интеллекта» выявляет многогранность этих понятий и необходимость чёткого разграничения для эффективного анализа и разработки.

Новое исследование предлагает четкие определения для ИИ-моделей и систем, стремясь разрешить терминологическую путаницу в быстро развивающейся области искусственного интеллекта.

InternVL-U: Искусственный интеллект, который понимает и творит

12.03.2026 от Денис Аветисян

InternVL-U демонстрирует универсальные мультимодальные возможности в генерации и редактировании изображений по текстовому запросу, охватывая широкий спектр задач - от пространственной ориентации и восприятия до научных исследований, юмористических зарисовок и логических умозаключений.

Новая модель объединяет возможности понимания и генерации изображений, открывая путь к более интеллектуальным мультимодальным системам.

Интерактивные помощники: новый рубеж оценки языковых моделей

12.03.2026 от Денис Аветисян

В отличие от статичного текста, мини-приложения преобразуют абстрактные объяснения в интуитивно понятные визуализации и открывают доступ к практическим задачам, таким как отслеживание диеты, которые ранее были невозможны.

Исследователи представили MiniAppBench — платформу для оценки способности больших языковых моделей создавать интерактивные HTML-приложения, имитирующие реальные инструменты и сервисы.

Научные таблицы и искусственный интеллект: где кроется главная сложность?

12.03.2026 от Денис Аветисян

Для оценки производительности моделей, таких как Qwen2-Audio, необходимо вычислить среднюю точность по различным настройкам для каждого языка и выявить язык, демонстрирующий наименьшие показатели, что позволяет определить наиболее сложные для анализа лингвистические особенности.

Новый бенчмарк SciTaRC демонстрирует, что современные системы искусственного интеллекта испытывают трудности не столько в планировании, сколько в точном выполнении вычислений при ответе на вопросы по научным таблицам.

Новая эра эффективности: компилятор и модели состояний для ускорения вычислений

12.03.2026 от Денис Аветисян

Авторегрессионная генерация на облачных TPU v6e демонстрирует, что кэширование значительно ускоряет процесс, снижая задержку генерации с квадратичной зависимости от длины последовательности до линейной, при этом обеспечивая стабильную пропускную способность независимо от этой длины, в то время как отсутствие кэширования приводит к резкому падению производительности.

Исследователи предлагают инновационный подход к реализации моделей состояний, позволяющий добиться значительного повышения скорости и эффективности вычислений на различных аппаратных платформах.