
Исследователи из токийского Университета электро‑коммуникаций (UEC) совершили необычное открытие: если позволить искусственным интеллектам вести себя более по‑человечески — перебивать друг друга, вмешиваться не в очередь или, наоборот, замолкать, когда нечего сказать, — их общая эффективность заметно растёт.
Обычно взаимодействие между ИИ‑агентами строится по строгому протоколу: один задаёт вопрос, второй генерирует ответ, затем слово передаётся следующему. Команда учёных решила проверить, что произойдёт, если снять с машин эти коммуникационные «ограничители».
Для эксперимента каждому ИИ‑агенту присвоили индивидуальные психологические черты согласно модели «большой пятёрки»: открытость, добросовестность, экстраверсию, доброжелательность и нейротизм. Но ключевым нововведением стал особый алгоритм. Он позволяет модели анализировать разговор не целиком, а постепенно — предложение за предложением — и на лету принимать решения о своём участии в диалоге.
Система научилась вычислять так называемый «показатель срочности». Если агент замечал ошибку или важный аргумент в речи другого, он мог немедленно вмешаться и указать на это, не дожидаясь своей очереди. В ситуациях, когда показатель оставался низким, модель предпочитала промолчать, чтобы не засорять диалог лишней информацией.
Эффективность подхода проверили на тесте MMLU — одном из самых авторитетных бенчмарков для оценки ИИ, который включает вопросы из естественных и гуманитарных наук. Результаты оказались впечатляющими. Когда один из агентов изначально давал неверный ответ, точность общей дискуссии выросла с 68,7% (при строгой очерёдности) до 79,2% — в сценарии с возможностью перебивать. В более сложной ситуации, когда ошибались сразу два агента, прогресс оказался ещё заметнее: точность повысилась с 37,2% до 49,5%.
Соавтор исследования, профессор Юити Сей (Yuichi Sei), пояснил, что естественная динамика спора позволяет нейросетям быстрее выявлять слабые места в аргументации и совместно приходить к верному решению. По его словам, «вежливые» дебаты, где все строго соблюдают очерёдность, зачастую проигрывают в эффективности хаотичным, но живым обсуждениям.