Диалог с движением: новый подход к генерации анимации по тексту

Исследователи предлагают инновационную систему, которая улучшает качество и соответствие генерируемых движений текстовым описаниям за счет постоянного взаимодействия и доработки.

АгроИнтеллект: Голос, Зрение и Текст на Службе Сельского Хозяйства

AgriGPT-Omni обучается посредством трехэтапного процесса, включающего предварительное обучение с использованием $2.2$ миллиардов текстовых токенов, обучение с подкреплением на основе $2.5$ тысяч аудио-вопросов и ответов, а также мультиязычную обработку данных, охватывающую шесть языков и включающую $600$ тысяч пар «изображение-текст» и $342$ тысячи пар «аудио-текст», что позволяет создать единую модель для аграрных задач.

Новая система объединяет возможности искусственного интеллекта для анализа изображений, речи и текста, открывая новые перспективы для автоматизации и повышения эффективности в аграрном секторе.

Визуальное ориентирование и язык: новый подход к навигации

Рамка CLASH объединяет небольшую реактивную модель и большую рефлексивную модель «зрение-язык» посредством механизма совместной работы, учитывающего неопределённость, и включает специализированные схемы прогнозирования промежуточных точек и целевых точек для применения как в симуляции, так и в реальных условиях.

Исследователи представили CLASH — систему, объединяющую быстрое реагирование и глубокое понимание языка для надежной навигации в реальном мире и виртуальной среде.

Распознавая подлог: Новый подход к выявлению замаскированного плагиата

Система SRAP функционирует на основе двойного потока: один - анализирует статистические аномалии в последовательностях токенов с помощью SciBERT, а другой - извлекает контекст из исходных научных текстов посредством SBERT и FAISS, после чего семантический движок восстанавливает оригинальную научную терминологию, объединяя эти потоки данных.

Исследователи предлагают систему, способную обнаруживать и восстанавливать намеренно искаженные фрагменты текста, используемые для сокрытия плагиата в научной литературе.

Язык без правил: Как нейросети учатся грамматике

Оценка суждений больших языковых моделей (LLM) о паразитических конструкциях выявила различия в точности в зависимости от языка и используемой модели, что подчеркивает влияние лингвистической специфики на эффективность подобных систем.

Новое исследование показывает, что большие языковые модели способны осваивать сложные грамматические конструкции, такие как инверсия подлежащего и вспомогательного глагола, исключительно на основе статистического анализа данных.

Французский для «Визуального Языка»: Как обучить модель понимать другой мир

Процесс дообучения демонстрирует снижение функции потерь при переходе от предварительно обученной английской модели к дообучению на французском языке, что указывает на успешную адаптацию к новому языковому домену.

Новое исследование показывает, что адаптация англоязычных моделей, объединяющих зрение и язык, к французскому языку может быть эффективнее при помощи простого перевода данных, чем при использовании сложных методов дообучения.

Ядро молекулы под наблюдением: новый взгляд на спектроскопию

Ядерный магнитный резонанс на наноуровне, примененный к одиночному мелко залегающему центру PL6, продемонстрировал когерентные спады в спектрах $^1$H ЯМР, зависящие от приложенного магнитного поля, что позволило определить гиромагнитное отношение $γ_H = 4.25(8)$ кГц/Г и установить глубину расположения сенсора на уровне $\sim 2.00(4)$ нм, подтвержденное анализом времени когерентности, полученным посредством последовательности динамического отстройки XY8-kk.

Ученые разработали метод регистрации ядерного магнитного резонанса на уровне одиночных молекул, используя уникальные свойства кремния и цветных центров.