Американская корпорация Google представила вторую версию фундаментальной модели Genie, которая может по текстовому описанию генерировать цифровые окружения и игровые миры. Первая версия вышла в феврале 2024 года и работала только с 2D-графикой на основе синтезированных изображений, а Genie 2 может генерировать трехмерные игры на основе текстовых команд.
Oб этом пишет kommersant.ru
Нейросеть может генерировать последовательные интерактивные миры длительностью около минуты, пользователи могут описать представленный мир, выбрать необходимый рендеринг и войти в полученное окружение. После совершения действий, например, нажатия клавиши на клавиатуре или движения мыши, Genie 2 имитирует их последствия.
Теперь нейросеть может создавать окружение с различными перспективами, например от третьего или первого лица, а также с изометрической камерой и запоминать элементы мира вне ее поля зрения. Появилась возможность моделировать взаимодействия с объектами, к примеру, открытие дверей, а также создавать интерактивное окружение на основе фотографий. Есть возможность моделировать персонажей, анимировать их, а также создавать взаимодействия с ними, моделировать эффекты дыма и воды, гравитацию, отражения и освещение.