Компанія Microsoft презентувала нову модель штучного інтелекту, яка здатна на основі нерухомого зображення обличчя та аудіозапису розмови автоматично створювати реалістичне відео, на якому ця людина говорить
Про це повідомляє CNN.
За допомогою цієї моделі ШІ, яка отримала назву VASA-1, на основі фотореалістичних облич, а також мультфільмів або художніх творів можна створювати відео з переконливою синхронізацією губ і природними рухами обличчя та голови.
В одному з демонстраційних відео науковці показали, як вони анімували Мону Лізу, щоб вона читала комедійний реп у виконанні акторки Енн Хетеуей.
Microsoft заявила, що ця технологія може бути використана в освіті або для «покращення доступності для людей з проблемами спілкування», або потенційно для створення віртуальних компаньйонів для людей.
Однак водночас зростає занепокоєння з приводу того, що цим інструментом можуть зловживати та видавати себе за реальних людей. Дехто з експертів також занепокоєний тим, що ця технологія може ще більше підірвати творчі індустрії — від кіно до реклами.
Наразі Microsoft заявила, що не планує випускати модель VASA-1 у відкритий доступ.
«Ми виступаємо проти будь-якої поведінки, спрямованої на створення оманливого або шкідливого контенту про реальних людей», — заявили дослідники Microsoft, додавши, що компанія «не планує випускати» продукт публічно, «поки не буде впевнена, що технологія буде використовуватися відповідально і відповідно до належних правил».
Дослідники стверджують, що нова модель ШІ від Microsoft була навчена на численних відеозаписах облич людей під час розмови, і вона здатна розпізнавати природні рухи обличчя і голови, включаючи «рух губ, вираз обличчя, погляд очей і моргання».
- У лютому повідомлялося, що провідні компанії в галузі штучного інтелекту, зокрема Google, Microsoft, OpenAI, Meta, TikTok і Adobe, планують підписати угоду, щоб виявляти та маркувати створений штучним інтелектом контент під час цьогорічних виборів у країнах світу.