Мета обучил агента ИИ играть в настольную игру, которая включает в себя общение с другими игроками, чтобы убедить их поддержать их стратегии, а затем предать их.
Компания, которой принадлежат Facebook, Instagram и WhatsApp, заявляет, что ее ИИ Cicero в ближайшем будущем может найти широкое применение, включая разработку более интеллектуальных виртуальных помощников с комбинированным использованием таких технологий, как обработка естественного языка (NLP) и стратегическое мышление. в сообщении в блоге, опубликованном компанией.
В исследовательской статье в академическом журнале Science Мета сказал, что его ИИ Цицерона достиг производительности человеческого уровня в стратегической игре Diplomacy в онлайн-лиге, где он сыграл 40 матчей против 82 человек, попав в 10% лучших игроков. кто сыграл не одну игру.
Diplomacy сталкивает семь игроков друг с другом за контроль над картой Европы. Каждый раунд начинается с того, что игроки ведут переговоры друг с другом, чтобы заручиться поддержкой своих планов, и заканчивается тем, что они одновременно пытаются выполнить свои ходы. Без поддержки других игроков многие из этих ходов потерпят неудачу.
По словам Мета, игра стала проблемой для агента ИИ, потому что для победы ему требовалось понять, блефуют ли его противники или вырабатывают определенную стратегию, чтобы выиграть игру. ИИ нужно было расширить определенный уровень эмпатии во время игры, чтобы наладить сотрудничество с другими игроками, чего ИИ не нужно было делать, играя в такие игры, как шахматы, против противников-людей.
Агенты ИИ с годами стали лучше играть в стратегические игры: в 1997 году программное обеспечение Deep Blue от IBM обыграло чемпиона мира по шахматам Гэри Каспарова, а в 2016 году AlphaGo от DeepMind обыграла лучшего игрока в го Ли Седоля. Facebook также разработал еще один движок искусственного интеллекта, который может превзойти людей в покере.
стратегическое мышление
Цицерон основан на двух основных технологических компонентах: стратегическом мышлении и обработке естественного языка (НЛП). В то время как механизм стратегического мышления предсказывает действия других игроков и использует эту информацию для формирования собственной стратегии, механизм обработки естественного языка генерирует сообщения и анализирует ответы в разговорах с другими игроками, чтобы договориться и заключить сделку, объяснили исследователи.
Чтобы помочь агенту ИИ генерировать релевантные разговоры, исследователи начали с модели генерации естественного языка с 2700 миллиардами параметров, предварительно обученной на тексте в Интернете, и усовершенствовали ее с помощью разговоров между игроками-людьми в более чем 40 000 игр webDiplomacy.net.
«Мы разработали методы автоматической аннотации сообщений в обучающих данных с соответствующими запланированными ходами в игре, чтобы во время вывода мы могли контролировать создание диалога для обсуждения конкретных действий, желаемых для агента и его партнеров по чату. исследователи сказали. — сказал он в более подробном отчете. Сообщение блога.
Meta открыла код Цицерона для других исследователей, чтобы они могли использовать возможности агента ИИ.
Кроме того, компания создала портал для размещения исследовательских предложений в области сотрудничества человека и ИИ посредством НЛП с использованием дипломатии в качестве центральной концепции.
долгосрочные проекты
Крупные технологические компании, такие как Microsoft, Google, Amazon, конкурируют друг с другом в разработке более интеллектуальных автономных виртуальных помощников для поддержки различных вариантов использования в бизнесе, от колл-центров до агентов ИИ, которые могут выполнять анализ настроений и обучать человека. новые способности. Согласно отчету Fortune Business Insights, мировой рынок обработки естественного языка (NLP), в который входят эти помощники, как ожидается, вырастет с 26,4 млрд евро в 2022 году до 161,8 млрд евро к 2029 году.
Исследователи Meta, похоже, предположили, что успех Цицерона в дипломатии превзошел возможности других виртуальных помощников, доступных сегодня, заявив в своем блоге: «Например, сегодняшние помощники ИИ могут выполнять простые задачи типа «вопрос-ответ». отчет. но что, если бы они могли вести долгую беседу с целью научить вас новому навыку? »
Это исследование таких инструментов, как Google Duplex, Amazon Alexa, Microsoft Xiaoice и Apple Siri. Но Цицерон не готов и к длительным разговорам, так как его рассуждения строго краткосрочны. Как пишут исследователи Meta в статье Science: «Стратегически Цицерон рассуждал о диалоге исключительно с точки зрения действий игрока в текущем раунде. Он не моделировал, как его диалоги могут повлиять на отношения с другими игроками на протяжении всей игры.
© 2022 IDG Communications, Inc.