Умнее и лаконичнее: сжатие рассуждений в больших языковых моделях

Самообучение с дистилляцией позволяет модели сохранять стабильную энтропию в процессе обучения, в отличие от обучения с подкреплением, использующего штрафы за длину, которое приводит к её коллапсу; представленный метод OPSDC обеспечивает обучение лаконичности без потери способности к исследованию, что подтверждается стабильностью энтропии моделей Qwen3-8B и Qwen3-14B.

Новый метод позволяет значительно сократить объем информации, необходимой для принятия решений моделями искусственного интеллекта, не теряя при этом их способности к сложным задачам.

Раскрывая тайны болезни Альцгеймера: новый взгляд на предсказание

Распределение классов диагнозов в исследуемом наборе данных демонстрирует относительную частоту встречаемости различных заболеваний, что критически важно для оценки потенциальных смещений в моделях машинного обучения и обеспечения их справедливого применения.

Исследователи разработали систему, способную предсказывать развитие болезни Альцгеймера на основе клинических данных и когнитивных тестов, одновременно объясняя, какие факторы оказывают наибольшее влияние.

Двурукие роботы учатся хватать всё: новый подход к универсальному захвату

В разработанном конвейере генерации данных разнообразные объекты и URDF-файлы робота импортируются в симулятор, после чего оптимизационный синтезатор захвата генерирует осуществимые варианты, из которых выбирается предпочтительный, а планирование движения используется для создания демонстрационных траекторий.

Исследователи разработали фреймворк UltraDexGrasp и масштабный синтетический набор данных, позволяющие бимануальным роботам осваивать сложные манипуляции с объектами.

Искусственный интеллект на службе правосудия: моделируя вопросы в судебных дебатах

Система моделирования устных прений, используя как промпт-инжиниринг с различными вариантами запросов для открытых и закрытых моделей, так и агентов, наделённых инструментами доступа к судебным материалам и статистике голосований, позволяет предсказывать реплики конкретных судей [latex]n^{th}[/latex] в ходе дискуссии, а двухступенчатая система оценки реалистичности и образовательной ценности полученных симуляций обеспечивает комплексный анализ качества воспроизведения судебного процесса.

Новое исследование демонстрирует, как современные системы искусственного интеллекта могут быть использованы для реалистичной симуляции вопросов, задаваемых судьями в ходе устных аргументов в Верховном суде США.

Диалог с Искусственным Интеллектом: Новые Испытания для Языковых Моделей

В статье представлена новая методика оценки языковых моделей, позволяющая проверить их способность к активному сбору информации и стратегическому мышлению в интерактивной среде.

Видение с акцентом на детали: новый подход к обработке изображений

В стандартной архитектуре ViT признаки в последних слоях стремятся к глобальной информации, в то время как в LocAtViT признаки патчей сохраняют локальную детализацию, что свидетельствует о более эффективном кодировании локальных характеристик.

Исследователи представили LocAtViT — модификацию Vision Transformer, повышающую точность задач плотного предсказания, таких как семантическая сегментация, без ущерба для общей производительности.