Майкрософт показал алгоритм для оживления фото. Из одного кадра делает видео и не его отличить от реальности
Инженеры Microsoft анонсировали выход нейросети нового поколения. VASA-1 способна заставить статичную фотографию стать видео — изображение сможет петь, говорить и двигаться.
Генеративный ИИ работает на основе снимка и аудиозаписи голоса реципиента. Алгоритмы трансформируют статику в реалистичные видеоролики. Более того, VASA-1 способна работать с портретами в любом художественном стиле.
В одном из демо-видео создатели показали, как Мона Лиза читает рэп:
http://www.youtube.com/watch?v=KIoZhgk-eio
Пока нейросеть создает видео с относительно невысоким разрешением, 512х512 пикселей и частотой 45 кадров в секунду. Позднее эти ограничения будут сняты:
http://www.youtube.com/watch?v=w0eYExk478I
В открытый доступ нейросеть еще не выкладывали. В Microsoft беспокоятся, что при помощи VASA-1 пользователи станут делать неэтичные видео.