StyleGAN от Nvidia может произвести революцию во многих творческих отраслях

StyleGAN от Nvidia может произвести революцию во многих творческих отраслях

Nvidia (клиент автора) в последнее время сделала много интересных вещей: от создания рабочих станций, предназначенных для проектирования метавселенной, до цифровых помощников, превращающихся в цифровых двойников человека, до инструментов, которые могут позволить любому создавать прекрасное искусство. Одним из наиболее интересных инструментов является Generator StyleGAN, который создает лица людей путем смешивания изображений.

Обучающий набор для этого предложения на основе искусственного интеллекта содержит 70 000 высококачественных изображений PNG (каждое с разрешением 1024 x 1024 пикселей), что дает пользователю практически неограниченную гибкость в использовании исходного материала.

StyleGAN существует с 2018 года, стал более широко доступен в 2019 году, когда исходный код стал открытым, и сейчас находится в своей третьей модификации. StyleGAN3 был запущен в октябре прошлого года.

Преимущества для тех из нас, кто работает с изображениями, включают потенциальную возможность создавать их из больших групп исходных изображений, защищенных авторским правом, не сталкиваясь с проблемами авторских прав и не беспокоясь о нарушении авторских прав. И по мере того, как процесс развивается и включает в себя другие изображения (по сути, это механизм слияния изображений), он может позволить вам смешивать профессиональные фотографии из разных источников для создания уникальных и красивых изображений или картин, созданных по памяти или воображению, практически не связанных с чем-либо реальным. .

Инструмент сопоставления изображений на основе искусственного интеллекта, такой как StyleGAN, может радикально изменить и улучшить ряд отраслей и практик (или использоваться для более гнусных «дипфейков»). Мы собираемся исследовать.

Автоматические зарисовщики преступлений?

Я смотрю много уголовных процессов по телевидению; Обычно есть фрагмент, в котором кто-то сидит перед художником-карикатуристом, чтобы создать образ преступника, за которым он наблюдал. Весь этот процесс может быть автоматизирован с помощью диалогового ИИ. Свидетелю можно показать развивающееся изображение с примерами функций, которые по требованию перемешиваются до тех пор, пока изображение не совпадет с воспоминаниями жертвы. Конечным результатом должно было стать фотореалистичное изображение, которое программы распознавания лиц могли бы использовать для быстрого обнаружения преступника. (Сопутствующим ущербом будет отсутствие необходимости в карикатуристах правоохранительных органов.)

Одна из областей, где эта технология может оказать большое влияние, — это поиск похищенных детей. ИИ может быстро состарить изображение ребенка, чтобы его было легче идентифицировать в дальнейшей жизни.

Маркетинг, телевидение и кино

Во многих маркетинговых материалах используются стоковые изображения или серийные модели. Проблема с первым заключается в том, что те же самые изображения могут использоваться в других кампаниях, непреднамеренно связывая разрозненные кампании. Например, если одно и то же изображение используется в рекламе лекарства и ресторана, клиенты могут связать их и избегать ресторана. Та же проблема может возникнуть в случае использования живой модели, которая затем попадает в другую кампанию, поскольку некоторые актеры и модели перемещаются между участниками. А у живых моделей/актеров могут возникнуть личные проблемы, которые могут навредить бренду или рекламной кампании.

Но использование изображений и видео, объединенных из чего-то вроде StyleGAN, означает, что вы можете создать изображение, которое может быть защищено авторскими правами вашей компании, уникальное по сравнению с любым стандартным изображением и не связанное с каким-либо актером или моделью, живым или мертвым. Результатом является снижение затрат и, что более важно, снижение риска. Вы получите результаты быстрее, а потребность в моделях и актерах уменьшится. Вы можете использовать актеров только в костюмах с трехмерными изображениями, которые скрывают их личность, а с развитием инструментов метавселенной и проигрывателей трехмерных изображений они могут вам даже не понадобиться. Это также приближает нас к тому, что актеры для фильмов не нужны.

Цифровые двойники человека?

Еще одна область, которую исследует Nvidia, — создание цифровых двойников метавселенной. И по мере совершенствования ИИ, стоящего за этими близнецами, они станут все более неотличимы от исходного материала. Когда это произойдет, кому принадлежит результат? Вы можете утверждать, что у сотрудника должен быть свой цифровой двойник. Но если такой инструмент, как StyleGAN, используется для перетасовки имиджа и навыков сотрудника, его положение становится более шатким; компания может быть в состоянии защитить свою собственность на результат. (Я надеюсь, что будущие сотрудники и профсоюзы столкнутся с серьезными проблемами, если что-то подобное будет использоваться для увольнения сотрудников без компенсации.

Смешанное будущее

Возможность делать ремиксы исходного материала, который может (или не может) быть защищен авторским правом в больших масштабах, является привлекательной, особенно если это устраняет потенциальные юридические проблемы. В процессе Nvidia используется проверенный источник изображений, что исключает юридическую разоблачение, но подобные инструменты не должны полагаться исключительно на базы данных фотографий; Их можно использовать на изображениях общественных деятелей, взятых из постов в социальных сетях, фильмов или других рекламных материалов.

Я надеюсь, что в какой-то момент эта технология заставит переписать законы об авторском праве, касающиеся составных изображений. В то же время они позволят сократить количество усилий и затрат, необходимых для создания фотореалистичных фильмов и изображений, которые можно использовать в бизнесе и развлечениях. Это ранний пример важных изменений в нынешней деловой практике и связанном с этим доходе для тех, кто работает моделями, актерами или режиссерами, а также для художников, которым поручено создавать изображения, определяющие запоминающиеся события.

Такие инструменты, как StyleGAN, изменят будущее виртуальных медиа для бизнеса, правительства и развлечений.

© 2022 IDG Communications, Inc.