Изследователи от Станфорд са разработили модел на изкуствен интелект (AI), EG3D, който може да генерира произволни изображения на лица и други обекти с висока разделителна способност заедно с основни геометрични структури

Изкуствено интелигентните модели наскоро напреднаха до такава степен, че потребителите скоро ще могат да използват тези модели за незабавно конструиране и промяна на почти фотореалистични триизмерни пейзажи от комфорта на своите лаптопи. Тъй като тези технологии улесняват генерирането на хиперреалистични аватари, те ще революционизират начина, по който артистите, работещи върху видео игри и CGI за филми, подхождат към работата си. От доста време AI успяват да създават реалистични 2D изображения. Въпреки това, 3D сценариите се оказаха по-предизвикателни поради необходимата огромна компютърна мощност. AI ​​моделът EG3D, създаден от екип от учени от Станфорд, може да се използва за създаване на произволни изображения с висока разделителна способност на лица и други неща, които имат основна геометрична структура. Този модел е един от първите 3D модели, които сега се използват, за да се постигне качество на изобразяване, близко до фотореализма.

Много популярен метод за машинно обучение, известен като generative adversarial network (GAN), се използва от EG3D и неговите предшественици за създаване на графики. Чрез използване на една невронна мрежа за създаване на изображения и друга за оценка на тяхната точност, тези системи противопоставят две невронни мрежи една срещу друга. Докато резултатът стане възможен, този процес се извършва многократно. Изследователите създадоха компонент, който може да трансформира тези изображения за 3D пространство чрез комбиниране на функции от вече съществуващи 2D GAN с висока разделителна способност. Тази сграда от две части постига две цели едновременно. Освен това е достатъчно бърз, за ​​да работи в реално време на лаптоп и може да се използва за създаване на сложни 3D дизайни. Той е съвместим с текущите архитектури и има ефективна изчислителна производителност.

Въпреки че е възможно да се използват инструменти като EG3D за създаване на 3D изображения, които са почти реалистични, все още съществува въпросът колко трудно е да се променят в софтуера за проектиране. Това е така, защото въпреки че резултатът е изображение, което може да се види, не е ясно как GAN са го създали. Модел на машинно обучение, наречен GiraffeHD, разработен от изследователи от Университета на Уисконсин-Медисън, може да бъде полезен в тази ситуация. Този модел е ефективен при премахване на манипулируеми характеристики от 3D изображения. Тя позволява на потребителя да избира множество елементи, включително форма, цвят и сцена или фон на изображението. GiraffeHD беше обучен с помощта на безброй снимки. За да конструира тези изображения по начин, при който тези много аспекти се държат като контролируеми променливи, моделът търси латентни фактори в изображението. Потребителите ще могат точно да променят характеристиките за желаните сценарии, като редактират тези контролируеми аспекти в 3D-генерирани снимки в бъдеще. По-значима тенденция е използването на AI за създаване на 3D снимки, включително EG3D и Giraffe HD. Въпреки това има още много работа за вършене по отношение на алгоритмичното отклонение и по-широката приложимост. Типът данни за обучение за хранене все още ограничава тези модели. Все още се провеждат изследвания за справяне с тези проблеми.

Въпреки че все още е в ранен етап, това изследване отваря възможности за по-реалистични 3D изображения и модели. Ще бъде интересно да видим накъде отива тази линия на изследване и как може да се приложи в бъдеще. Ще се радвам да чуя вашите мисли за този нов подход в нашия ML Subreddit.

This Article is written as a summary article by Marktechpost Staff based on the paper 'Efficient Geometry-aware 3D Generative Adversarial Networks'. All Credit For This Research Goes To Researchers on This Project. Checkout the paper, github and reference article.

Please Don't Forget To Join Our ML Subreddit

Leave a Comment