ИИ теперь может играть в Minecraft так же, как и вы — вот почему это важно

ИИ теперь может играть в Minecraft так же, как и вы — вот почему это важно

Эксперты OpenAI обучили нейронную сеть играть в Minecraft на уровне, не уступающем игрокам-людям.

Нейронная сеть была обучена на 70 000 часов разнообразных игровых кадров, дополненных небольшой базой данных видео, в которых подрядчики выполняли определенные внутриигровые задачи, а также записывались вводы с клавиатуры и мыши.

После корректировки OpenAI обнаружил, что модель способна выполнять всевозможные сложные способности, от плавания до охоты на животных и поедания их мяса. Он также ухватился за «прыжок со столба», когда игрок подкладывает под себя блок материала в середине прыжка, чтобы набрать высоту.

Возможно, наиболее впечатляющим является то, что ИИ смог создать алмазные инструменты (для чего требовалось последовательное выполнение длинной серии действий), что OpenAI назвал «беспрецедентным» достижением для компьютерного агента.

Прорыв в ИИ?

Значение проекта Minecraft заключается в том, что он демонстрирует эффективность нового метода, который OpenAI реализует для обучения моделей ИИ, который называется Video PreTraining (VPT), ​​который, по словам компании, может ускорить разработку «агентов, использующих обычные компьютеры». "

Исторически сложилось так, что сложность использования необработанного видео в качестве источника для обучения моделей ИИ заключалась в том, что происходящее достаточно просто для понимания, но не обязательно как. Это связано с тем, что модель ИИ будет поглощать желаемые результаты, но не будет понимать входные комбинации, необходимые для их достижения.

Однако с помощью VPT OpenAI объединяет большой набор видеоданных, извлеченных из общедоступных веб-источников, с набором тщательно отобранных изображений, помеченных соответствующими движениями клавиатуры и мыши, для создания базовой модели.

Чтобы уточнить базовую модель, команда включает меньшие наборы данных, предназначенные для обучения конкретным задачам. В этом контексте OpenAI использовал кадры, на которых игроки выполняли ранние игровые действия, такие как валка деревьев и создание столов для крафта, что привело бы к «значительному повышению» надежности, с которой модель могла выполнять эти задачи.

Другой метод заключается в том, чтобы «вознаграждать» модель ИИ за выполнение каждого шага в последовательности задач, практика, известная как обучение с подкреплением. Именно этот процесс позволил нейросети собрать все ингредиенты для алмазной кирки с вероятностью успеха на уровне человека.

«VPT позволяет агентам учиться действовать, просматривая большое количество видеороликов в Интернете. По сравнению с генеративным видеомоделированием или контрастными методами, которые создают только репрезентативные фоны, VPT предлагает захватывающую возможность «обучения непосредственно на крупномасштабных поведенческие предшественники видео не только в языке», — объяснил OpenAI в своем блоге (открывается в новой вкладке).

«Хотя мы экспериментируем только с Minecraft, игра очень открыта, а собственный человеческий интерфейс (мышь и клавиатура) очень общий, поэтому мы считаем, что наши результаты хорошо подходят для других подобных областей, например, для использования компьютера».

Чтобы стимулировать новые эксперименты в этой области, OpenAI заключила партнерское соглашение с конкурсом MineRL NeurIPS, пожертвовав свои бизнес-данные и код модели участникам, пытающимся использовать ИИ для решения сложных задач Minecraft. Главный приз: €100,000 XNUMX.