Денис Аветисян — Страница 449

Тензорные сети: Новый подход к оптимизации

10.11.2025 от Денис Аветисян

$Тензор нулевого порядка, представленный как 𝒩𝐫\mathcal{N}\_{\mathbf{r}}.𝒪∈ℂn1×n2×⋯×nd\mathcal{O}\in{{\mathbb{C}}}^{n\_{1}\times n\_{2}\times\cdots\times n\_{d}}, служит основой для геометрического представления, определяющего структуру данных в многомерном комплексном пространстве.$

Исследование представляет геометрическую основу для эффективной декомпозиции и оптимизации тензорных сетей, открывая возможности для решения сложных задач.

Оживляя текст: новый подход к генерации видео

09.11.2025 от Денис Аветисян

В архитектуре RISE-T2V адаптер перефразирования интегрирует возможности больших языковых моделей и диффузионных моделей, позволяя генерировать видео на основе скрытых состояний текста, полученных из предсказания следующего токена, а двухэтапная схема обучения сначала адаптирует текстовые кодировки, а затем обеспечивает адаптацию движения.

Исследователи разработали метод, позволяющий создавать более качественные и детализированные видеоролики на основе текстовых описаний.

Знания в графах: как улучшить ответы больших языковых моделей

09.11.2025 от Денис Аветисян

Несмотря на то, что расширение извлекаемого подграфа для SubgraphRAG закономерно повышает полноту релевантных фактов и узлов, точность предсказаний (EM Hits) в конечном итоге стабилизируется из-за добавления избыточной информации, при этом обучение на подграфах с истинными ответами демонстрирует более высокие результаты, чем обучение на кратчайших путях триплетов.

Новый подход к генерации синтетических данных позволяет создавать более точные и надежные знания для обучения и оценки языковых моделей, использующих графы знаний.

Медицинский взгляд: Новая модель для анализа снимков грудной клетки

09.11.2025 от Денис Аветисян

Медицинские изображения подвергаются многократному увеличению с использованием двух глобальных разрешений и восьми локальных, что обеспечивает всестороннее извлечение признаков и повышает надежность анализа.

Представлена MedDChest – модель, обученная с нуля для точной интерпретации рентгеновских и томографических изображений грудной клетки.

Игры потенциала: на пути к равновесию

09.11.2025 от Денис Аветисян

В ходе экспериментов с градиентным спуском в невозмущенной и слегка возмущенной играх выяснилось, что алгоритм часто сходится к равновесию Нэша с существенно более низким уровнем благосостояния, чем к оптимальной точке (R1, C1), расположенной в левом нижнем углу, что указывает на чувствительность к начальным условиям и потенциальную неэффективность стандартного градиентного спуска.

Исследование сложности вычисления различных видов равновесий в потенциальных играх, от стандартного равновесия Нэша до более строгих уточнений.

Архитектор-пилот: Автоматизированный поиск оптимальных нейронных сетей

09.11.2025 от Денис Аветисян

Архитектура ArchPilot осуществляет автоматизированный поиск оптимальных обучающих скриптов посредством координации агента оркестровки, использующего метод Монте-Карло для выбора перспективных решений, агента генерации, ответственного за разработку и отладку этих скриптов, и агента оценки, проводящего тестирование и предоставляющего количественные метрики для оценки эффективности каждого решения.

Новый подход к поиску архитектур нейронных сетей, использующий взаимодействие нескольких агентов для повышения эффективности и снижения вычислительных затрат.

Призрачная уверенность: почему языковые модели ошибаются даже тогда, когда уверены

09.11.2025 от Денис Аветисян

При отсутствии неопределённости в данных, глубинная структура многослойного перцептрона демонстрирует способность к удовлетворительной ранжировке, однако при наличии даже незначительной неоднозначности эта способность резко снижается, указывая на то, что скрытые состояния не надёжно кодируют информацию об этой неоднозначности.

Новое исследование показывает, что существующие методы оценки неопределенности больших языковых моделей оказываются неэффективными при работе с неоднозначными вопросами.

Идентификация людей: новый взгляд на походку и кросс-модальное обучение

09.11.2025 от Денис Аветисян

Существующие методы распознавания людей по походке, полагающиеся на анализ изображений, часто страдают от неточных сегментаций и игнорирования динамики движения, в то время как DinoGRL использует мощные визуальные представления для создания чётких силуэтов, позволяющих интегрировать характеристики походки и внешности для достижения надёжной и устойчивой к различным условиям идентификации.

Предложенный метод объединяет визуальные и инфракрасные данные, используя особенности походки для повышения точности идентификации людей в видеопотоке.

Ошибка в оценках: Как точно настроить алгоритмы стохастического градиентного спуска

09.11.2025 от Денис Аветисян

На графике, отображающем зависимость ошибки выборки от размера шага для алгоритмов SG-UBU, SVRG-UBU и SAGA-UBU при различных количествах компонент (10, 50, 100, 500), наблюдается закономерность, указывающая на то, что уменьшение размера шага приводит к снижению ошибки, при этом влияние этого параметра проявляется схожим образом для всех исследуемых алгоритмов и независимо от количества компонент.

Новое исследование раскрывает фазовый переход в скорости сходимости алгоритмов, использующих уменьшение дисперсии, и предлагает критерии для оптимального выбора метода.

Как заставить языковые модели говорить правду?

09.11.2025 от Денис Аветисян

Адаптивная схема декодирования GRAD демонстрирует повышение точности генерации текста за счёт использования графа переходов между токенами (TTG), построенного на небольшом корпусе и позволяющего корректировать прогнозы модели путём адаптивного объединения логитов, что в данном примере позволило скорректировать ошибочный прогноз

Новый подход к декодированию помогает снизить галлюцинации и повысить достоверность генерируемого текста.