AI Google навчився створювати 3D-сцени з зображень

У 2014 році британський стартап DeepMind був куплений компанією Google. І це той випадок, коли купівлю можна назвати успішною. Сьогодні DeepMind демонструє новітні технології в області штучного інтелекту, і однією з таких є фреймворк Generative Query Network (GQN), про який сьогодні піде мова.

Як правило, для нейромереж, заснованих на роботі з зображеннями, використовується база з величезним безліччю картинок. Щоб штучний інтелект надалі міг визначати об’єкти на фотографіях, необхідно на картинках з бази вручну відзначати об’єкти, наприклад, диван, підлогу, крісло і так далі. Цей процес досить трудомісткий і вимагає багато часу.

Тому розробники Google придумали новий, більш технологічний метод. Суть його полягає в тому, що штучний інтелект буде сам визначати об’єкти, доповнювати сцени, розуміти, які дії відбуваються в кадрі, враховувати освітлення, матеріали різних об’єктів. Тепер для створення 3D-сцен з 2D-зображень потрібно буде лише показати штучного інтелекту зображення сцени, і все буде готово.

Нижче видно, як ІЇ на основі одного зображення будує цілу сцену:

Поки що проект знаходиться на ранньому етапі розробки, і говорити про складних сценах не доводиться. Але навіть зараз результат приголомшливий.

Думкою діліться у Telegram-чаті або нижче в коментарях.

За матеріалами deepmind