«Если вы отправитесь на Bing, и поищете птицу, то получите множество похожих картинок с птицей, но здесь фотографии создаются с помощью компьютера с нуля, пиксель за пикселем . Эти птицы могут и не существовать в реальном мире – они являются «воображением» нашего компьютера», – пояснил глава центра глубоких исследований в лаборатории Microsoft Сяодун Хэ.
Как сообщает Engadget, в Microsoft видят применение своего алгоритма в создании анимационных фильмов.
Стоит отметить, что специалисты Microsoft также проводят исследования в области компьютерного зрения и обработки естественного языка с помощью CaptionBot. Речь идет об ИИ-системе, которая автоматически создает подписи к фотографиям. Кроме того, исследователи создали систему, отвечающую на вопросы, связанные с изображениями под названием SeeingAI, которая может быть полезной для слепых.
Технология состоит из двух частей: Generative Adversarial Network (GAN), генерирующей изображения, а также дискриминатора, оценивающего их качество. CaptionBot «обучался» на парах изображений и подписей, которые подсказывают, как слова соотносятся с конкретными рисунками.