Иллюзии Правдоподобия: Как Разоблачить «Галлюцинации» Больших Языковых Моделей

Система FaithLens способна комплексно оценивать достоверность утверждений относительно представленного документа, выявляя как соответствия фактам, так и случаи галлюцинаций, и предоставлять обоснование принятых решений для широкого спектра задач.

Новая методика позволяет выявлять и объяснять случаи, когда языковые модели генерируют кажущиеся правдоподобными, но фактически неверные утверждения.

Взгляд в будущее нейрорадиологии: тандем человека и искусственного интеллекта

Новое исследование демонстрирует, что совместная работа врачей-радиологов и систем искусственного интеллекта значительно повышает точность диагностики опухолей головного мозга.

Ожившие аватары: Искусственный интеллект, моделирующий мир вокруг

В отличие от подходов, генерирующих пассивные движения с ограниченным пониманием семантики, разработанная архитектура ORCA, использующая цикл наблюдения-размышления-действия-рефлексии (OTAR), позволяет добиться выполнения сложных, многошаговых задач.

Новый подход позволяет видео-аватарам действовать осмысленно и долгосрочно в интерактивных средах, благодаря способности строить внутренние модели мира.

Наука, управляемая интеллектом: Bohrium и SciMaster для масштабирования исследований

Инфраструктура Bohrium+SciMaster преобразует научные ресурсы - данные, программное обеспечение, вычислительные мощности и лабораторное оборудование - в готовые к использованию инструменты для анализа, вычислений и экспериментов, обеспечивая унифицированные интерфейсы, наблюдаемость и управление, а также поддерживая стандартизированную упаковку и контролируемое исполнение переиспользуемых инструментов и рабочих процессов, при этом сообщества Open AI4S, такие как DeepModeling, вносят вклад в создание переиспользуемых открытых исходных кодов, интегрируемых в рабочие процессы, а SciMaster оркестрирует эти возможности в долгосрочные, расширенные инструментами, многоагентные рабочие процессы, позволяя осуществлять непрерывное совершенствование в масштабах всей экосистемы на основе трассировки исполнения и распределенных сигналов валидации.

Новая инфраструктура и экосистема Bohrium+SciMaster открывают возможности для автоматизации научных процессов и совместной работы человека и искусственного интеллекта.

Глубокое исследование: новый подход к автоматизации научных задач

Агент глубокого исследования Step-DeepResearch демонстрирует способность эффективно работать как с открытыми, так и с коммерческими моделями, подтверждая свою универсальность и адаптивность в различных вычислительных средах.

Представлена система Step-DeepResearch, позволяющая эффективно проводить глубокий анализ данных и решать сложные исследовательские задачи с использованием современных агентных систем.

Искусственный физик: новый шаг к автоматизации научных исследований

Физическая модель PhysMaster реализует ключевые принципы симуляции, позволяя точно воспроизводить динамику сложных систем посредством решения уравнений движения, таких как $F = ma$, и моделирования сил взаимодействия, что обеспечивает высокую степень реализма и надежности результатов.

Ученые представили систему, способную самостоятельно решать задачи теоретической и вычислительной физики, открывая возможности для ускорения научных открытий.

Видеорассказы без границ: StoryMem и искусство длинных видео

Исходя из предоставленного сценария и текстовых описаний каждого кадра, система StoryMem способна генерировать привлекательные, многокадровые повествовательные видео продолжительностью около минуты, отличающиеся высокой связностью персонажей и кинематографическим качеством изображения, что достигается за счёт последовательной генерации кадров с использованием диффузионной модели видео, обусловленной памятью.

Новая модель StoryMem позволяет создавать связные и увлекательные видеоролики продолжительностью в несколько минут, используя визуальную память для поддержания последовательности повествования.

Трансформеры: За гранью универсальности

В статье представлен обзор теоретических возможностей архитектур, основанных на трансформерах, и исследуется вопрос о том, насколько сильно ограничения в архитектуре влияют на их производительность.

Разумные агенты: оптимизация скорости и надёжности

Агентский фреймворк AgentInfer структурирован как набор модулей, обеспечивающих комплексный подход к выводу и применению знаний, позволяя эффективно решать задачи, требующие интеллектуального анализа и адаптации.

Новый подход к проектированию автономных агентов позволяет значительно сократить задержки и повысить стабильность работы, объединяя методы оптимизации на уровне логики и системной архитектуры.

Код без уязвимостей: Новый датасет для обучения безопасной генерации кода

Набор данных SecureCode v2.0 демонстрирует превосходство по сравнению с существующими аналогами, обеспечивая 100%-ное сопоставление инцидентов и являясь единственным набором данных, поддерживающим формат диалога, что подтверждает его уникальность по размеру, языковому охвату и структуре.

Представлен SecureCode v2.0 — комплексный набор данных, призванный помочь AI-ассистентам создавать более безопасный код, основанный на реальных инцидентах и практиках безопасности.