В последнее время Nvidia (клиент автора) сделала много интересных вещей, от создания рабочих станций, предназначенных для проектирования метавселенной, до цифровых помощников, которые превращаются в цифровых двойников человека, до инструментов, которые могут позволить любому создавать привлекательные произведения искусства. Одним из самых интересных инструментов является Generator StyleGAN, который создает лица людей путем смешивания изображений.
Учебный набор для этого предложения на основе искусственного интеллекта содержит 70 000 высококачественных изображений PNG (каждое с разрешением 1024 x 1024 пикселей), которые предоставляют пользователю практически неограниченную гибкость исходного материала.
StyleGAN существует с 2018 года, стал более доступным в 2019 году, когда исходный код стал открытым, и сейчас находится в третьей модификации. StyleGAN3 был выпущен в октябре прошлого года.
Преимущества для тех из нас, кто работает с изображениями, включают потенциальную возможность создавать изображения из больших пулов исходных изображений, защищенных авторским правом, не сталкиваясь с проблемами авторского права и не беспокоясь о нарушении авторских прав. И по мере того, как процесс будет включать в себя другие изображения (по сути, это механизм слияния изображений), он может позволить вам смешивать профессиональные фотографии из разных источников для создания уникальных и красивых изображений или картин, созданных по памяти или воображению, практически без усилий. ни к чему реальному.
Инструмент сопоставления изображений на основе ИИ, такой как StyleGAN, может радикально изменить и улучшить ряд отраслей и практик (или использоваться для более гнусных «глубоких подделок»). Мы собираемся исследовать.
Tabla de contenido
Криминальные мультипликаторы?
Я вижу много уголовных процессов по телевидению; обычно есть сегмент, в котором кто-то сидит напротив карикатуриста, чтобы создать образ преступника, за которым он наблюдал. Весь этот процесс может быть автоматизирован с помощью диалогового ИИ. Свидетелю может быть показано развивающееся изображение с образцами функций, которые по запросу перемешиваются до тех пор, пока изображение не совпадет с памятью жертвы. Конечным результатом будет фотореалистичное изображение, которое может быть использовано программами распознавания лиц для быстрого обнаружения преступника. (Побочным ущербом будет отсутствие необходимости в карикатуристах правоохранительных органов.)
Одной из областей, где эта технология может оказать большое влияние, является поиск похищенных детей. ИИ может быстро состарить изображение ребенка, чтобы его лучше можно было идентифицировать в более позднем возрасте.
Маркетинг, телевидение и кино
Во многих маркетинговых материалах используются стоковые изображения или производственные модели. Проблема с первым заключается в том, что те же самые изображения могут использоваться в других кампаниях, непреднамеренно связывая разрозненные кампании вместе. Например, если одно и то же изображение используется в рекламе лекарства и ресторана, клиенты могут ассоциировать их и избегать ресторана. Та же проблема может возникнуть при использовании живой модели, которая затем оказывается в другой кампании, поскольку некоторые актеры и модели перемещаются между участниками. А у живых моделей/актеров могут быть личные проблемы, которые могут повредить бренду или рекламной кампании.
Но использование комбинированных изображений и видео из чего-то вроде StyleGAN означает, что вы можете создать изображение, которое может быть защищено авторскими правами вашей компании, уникальное из любого стокового изображения и не привязанное к какому-либо актеру или модели, живому или мертвому. В результате снижается стоимость и, что более важно, снижается риск. Вы получите результаты быстрее, а потребность в моделях и актерах уменьшится. Вы можете использовать только актеров в костюмах 3D-изображений, которые скрывают их личность, а с достижениями в инструментах метавселенной и проигрывателях 3D-изображений они могут вам даже не понадобиться. Это также приближает нас к тому, что нам не нужны актеры для фильмов.
Цифровые близнецы человека?
Еще одна область, которую исследует Nvidia, связана с созданием цифровых двойников для метавселенной. И по мере улучшения ИИ, стоящего за этими близнецами, они станут более неотличимы от исходного материала. Когда это происходит, кому принадлежит результат? Вы можете возразить, что сотрудник должен владеть своим цифровым двойником. Но если такой инструмент, как StyleGAN, используется для смешивания изображений и навыков сотрудника, его положение становится более ненадежным; компания может быть в состоянии защитить свою собственность от результата. (Я надеюсь, что у будущих сотрудников и профсоюзов возникнут серьезные проблемы с использованием чего-то подобного для увольнения сотрудников без компенсации.
смешанное будущее
Возможность ремикшировать исходный материал, который может (или не может) быть защищен авторским правом в больших масштабах, является привлекательной, особенно если это устраняет потенциальные юридические проблемы. В процессе Nvidia используется проверенный источник изображения, что устраняет юридическую опасность, но подобные инструменты не должны полагаться исключительно на базы данных фотографий; могут использоваться в изображениях общественных деятелей, взятых из постов в социальных сетях, фильмов или других рекламных материалов.
Я надеюсь, что в какой-то момент эта технология заставит переписать законы об авторском праве, касающиеся составных изображений. В то же время они сократят количество усилий и затрат, необходимых для создания фотореалистичных фильмов и изображений, которые можно использовать в бизнесе и развлечениях. Это ранний пример серьезных изменений в текущей деловой практике и связанного с этим дохода для тех, кто работает моделями, актерами или режиссерами, а также для художников, которым поручено создавать образы, определяющие запоминающиеся события.
Такие инструменты, как StyleGAN, изменят будущее виртуальных медиа для бизнеса, правительства и развлечений.
© 2022 IDG Communications, Inc.