Как оценить оценки: новый взгляд на методологию

В статье представлена формальная основа для систематического сравнения и улучшения методов оценки в различных научных областях.

В статье представлена формальная основа для систематического сравнения и улучшения методов оценки в различных научных областях.

В статье представлен обзор текущего состояния оценки больших языковых моделей в юридической сфере и обозначены ключевые вызовы для их внедрения.
В статье представлена строгая математическая модель алгоритмов оптимизации на основе колоний муравьев, позволяющая глубоко анализировать их поведение и возможности распараллеливания.

Новое исследование посвящено методам квантования, позволяющим значительно сократить размер многомодальных моделей, без существенной потери качества.
![Основанный на вероятностной природе p-битов, алгоритм имитации отжига [latex]\tilde{1}[/latex] отображает комбинационную задачу оптимизации на модель Изинга, в которой каждый p-бит подвержен смещению <i>h</i> и взаимодействует с другими битами посредством весов <i>J</i>, стремясь к минимизации энергии [latex]H_{min}[/latex] и, следовательно, к нахождению решения исходной задачи.](https://arxiv.org/html/2601.14476v1/x1.png)
Новое исследование демонстрирует, как ускорить алгоритмы имитации отжига, используя вероятностные биты и графические процессоры, и как компенсировать влияние вариативности в современных микросхемах.
Исследователи представили SearchGym — симуляционную среду, позволяющую создавать и обучать поисковых агентов с высокой эффективностью и точностью.

В статье рассматривается возможность автоматизации процесса исследований в области искусственного интеллекта путем создания системы, способной самостоятельно генерировать и проверять новые идеи.
![Алгоритм кванмеханической траектории использует вычислительный граф, в котором детерминированные узлы вычисляют функции [latex]f[/latex] на основе входных данных, а стохастические узлы осуществляют выборку случайных переменных из распределения [latex]p[/latex], зависящего от параметров Θ, при этом как гамильтониан [latex]H[/latex], так и оператор скачка [latex]C[/latex] зависят от этих параметров.](https://arxiv.org/html/2601.14399v1/plots/Qtraj_graph.png)
Новый метод дифференцируемого моделирования позволяет эффективно оценивать транспортные свойства кварк-глюонной плазмы, возникающей в столкновениях тяжелых ионов.

Исследователи представили RPC-Bench — комплексную платформу для оценки способности моделей искусственного интеллекта анализировать и понимать научные публикации.
Квантовые Заметки: Размышления о Современных Исследованиях Парадоксально, но для того, чтобы увидеть квантовый мир, нужно его сначала очень сильно охладить. И судя по последним новостям, это не только научная необходимость, но и вполне себе бизнес-возможность. Охлаждение и Эффективность MIT разработал новый метод охлаждения ионов в квантовых компьютерах, используя свет. Знаете, как летом можно охладиться, стоя … Читать далее