Проверка смарт-контрактов: новый рубеж для языковых моделей

Архитектура EVM-QuestBench определяет задачи посредством JSON-спецификаций, динамически преобразуя их в конкретные экземпляры, выполняемые через унифицированный TypeScript-интерфейс и оцениваемые валидаторами, при этом составные задачи дополнительно учитывают снижение эффективности с каждым шагом.

Исследователи представили EVM-QuestBench — комплексный набор тестов, позволяющий оценить способность искусственного интеллекта генерировать код транзакций для блокчейнов Ethereum.

Эволюция инструментов мышления: новый подход к научным открытиям

В отличие от статических подходов, требующих заранее собранных библиотек инструментов с ограниченным охватом и адаптивностью, предложенная методика эволюции инструментов во время тестирования начинается с пустой библиотеки и генерирует необходимые инструменты по мере решения задачи, обеспечивая непрерывную адаптацию к новым областям и проблемам.

Исследователи предлагают принципиально новый способ решения научных задач, основанный на динамическом создании и адаптации инструментов в процессе работы.

Квантовый горизонт: Размышления о безопасности и будущем

Квантовый горизонт: Размышления о безопасности и будущем Представьте себе парадокс: мы строим крепость из новых материалов, но забываем заложить фундамент. Именно это происходит сейчас с квантовой безопасностью. Мы увлечены созданием новых алгоритмов, но игнорируем уязвимости в существующих системах и инфраструктуре. По сути, квантовая безопасность — это не просто замена одного алгоритма другим. Это переосмысление всей … Читать далее

Память о событиях: новый подход к долгосрочному мышлению

Иерархическая архитектура памяти SEEM преобразует неструктурированные взаимодействия в двухслойное представление, объединяя семантический слой памяти графов для статических фактов со структурированным слоем эпизодической памяти для динамичных событий, что позволяет агенту эффективно синергировать устойчивые знания о фактах с изменчивыми нарративными контекстами для последовательного долгосрочного рассуждения.

Исследователи предлагают иерархическую структуру памяти, позволяющую агентам на основе больших языковых моделей сохранять и эффективно использовать информацию о прошлых событиях для более сложных рассуждений.

Зрение машин: Обработка изображений в реальном времени для встраиваемых систем

Новый обзор посвящен оптимизации алгоритмов обработки изображений для работы на устройствах с ограниченными ресурсами, открывая возможности для автономных систем и робототехники.

Искусственный интеллект, действующий самостоятельно: вызовы для общества и технологий

Данная работа фокусируется на изучении агентивных систем искусственного интеллекта в рамках социотехнического подхода, подчеркивая их взаимодействие с обществом и технологиями.

Статья посвящена анализу комплексного влияния автономных систем искусственного интеллекта на социум и необходимость учитывать этические аспекты и принципы управления при их разработке.

Оптимизация партийных запросов: Метод имитации отжига против градиентных подходов

Для кампании по оптимизации материалов с пятью целями, параллельная реализация имитации отжига демонстрирует превосходную сходимость по сравнению с последовательным подходом, достигая более высоких конечных значений гиперобъема и ускоряя процесс за счет оценки кандидатов с использованием GPU.

В новой работе исследователи продемонстрировали, что метод имитации отжига превосходит традиционные методы оптимизации при выборе наиболее перспективных кандидатов в задачах многоцелевой байесовской оптимизации.

Документы будущего: Искусственный интеллект на службе прозрачности данных

Представлена система, связывающая фрагменты текста с соответствующими данными, позволяя визуализировать прозрачные документы, где каждое текстовое упоминание напрямую связано с лежащими в его основе данными, обеспечивая интерактивное и контекстуальное представление информации.

Новая система объединяет возможности больших языковых моделей и отслеживание происхождения данных, создавая документы, в которых каждое утверждение можно проверить и связать с исходными данными.

Иллюзия точности: Почему стандартные метрики не отражают качество речевых моделей

В исследовании выявлено, что альтернативные методы оценки согласованности моделей распознавания речи демонстрируют более высокую корреляцию с человеческой оценкой, чем традиционная метрика глобальной токеновой перплексии ([latex]Global-PPL[/latex]), при этом расхождения между оценками различных методов уменьшаются по мере улучшения производительности модели, однако при высоких значениях [latex]Global-PPL[/latex] наблюдается насыщение отклонений, обусловленное достижением предельной производительности.

Новое исследование показывает, что общепринятые способы оценки речевых моделей могут вводить в заблуждение, не учитывая нюансы локального контекста.

Искусственный интеллект: где заканчивается наука и начинается разработка?

Передовые исследовательские лаборатории склонны к найму специалистов с уклоном в исследования, при этом общее количество вакансий у них меньше, в то время как крупные предприятия, занимающиеся вертикальным искусственным интеллектом, SaaS и крупными технологиями, предпочитают нанимать инженеров, предлагая больше вакансий.

Новая статья исследует размытие границ между научными исследованиями и инженерной практикой в области искусственного интеллекта, демонстрируя рост числа гибридных ролей и кросс-функциональных команд.