Вражаюча програма штучного інтелекту, яка відтворює обличчя з аудіо

Speeech2Face - це дослідження, яке показало, що можна дізнатися, як виглядає обличчя людини лише невеликим фрагментом його голосу

Guardar
Imagen BGMQY5TCD5DZFKSCND2XHWPGMA

Технологія продовжує зростати семимильними кроками, спираючись на кілька областей для вивчення нових можливостей і функцій. Одна з них - вміти «реконструювати» обличчя людини через фрагмент голосу.

Дослідження Speech2Face ,представлене в 2019 році на конференції Vision and Recovition Patterns, показало, що Штучний інтелект (AI) можерозшифрувати зовнішність людини за допомогою коротких аудіосегментів.

У статті пояснюється, що метою дослідників Те-Хён Он, Талі Декель, Чангіля Кіма, ІнбарМосері, Вільяма Фрімена та Майкла Рубінштейна програми досліджень і науки MIT є не реконструкція обличчя людей однаково, а зробити образ з фізичними характеристиками, які пов'язані з проаналізовано аудіо.

Щоб досягти цього, вони використовували, розробили та навчили глибоку нейронну мережу , яка проаналізувала мільйони відео, знятих з YouTube, де люди розмовляють. Під час навчання модель навчилася співвідносити голоси з обличчями, дозволяючи створювати зображення з фізичними ознаками, схожими на ораторів, включаючи вік, стать та етнічну приналежність.

Infobae

Тренінг проводився під наглядом та з використанням узгодження облич та голосів інтернет-відео, без необхідності моделювати детальні фізичні характеристики обличчя.

Вони детально розповіли, що оскільки це дослідження може мати аспекти, чутливі до етнічної приналежності, а також приватності, це те, що до відтворення облич не додано жодних конкретних фізичних аспектів, і вони запевняють, що, як і будь-яка інша системамашинного навчання, вона з часом покращується, оскільки при кожному використанні збільшує свою бібліотеку знань.

Хоча показані тести показують, що Speeech2Face має велику кількість збігів між обличчями та голосами, він також мав деякі недоліки, де етнічна приналежність, вік чи стать не відповідали використовуваному вибірці голосу.

Infobae

Модель призначена для представлення статистичних кореляцій, які існують між рисами обличчя з голосом. Слід пам'ятати, що AI вивчили через відео YouTube, які не представляють реальної вибірки населення в світі, наприклад, в деяких мовах він показує розбіжності з даними навчання.

У цьому сенсі саме дослідження рекомендує наприкінці своїх результатів, щоб ті, хто вирішив дослідити та модернізувати систему, розглянути ширший вибірку людей та голосів, щоб машинне навчання мало ширший репертуар відповідності та відтворення облич.

Програма також змогла відтворити голос у мультфільмах, які також мають неймовірну схожість з голосами проаналізованих аудіо.

Оскільки ця технологія також може бути використана для зловмисних цілей, відтворення обличчя залишається максимально наближеним до людини і не дає повних облич, оскільки це може бути проблемою для конфіденційності людей. Тим не менш, дивно, що технологія може зробити з аудіо зразків.

ПРОДОВЖУЙТЕЧИТАТИ:

Más Noticias

Álvaro Uribe afirmó que una sobrina suya quiere ser como Karol G y habló del éxito de Shakira en Copacabana: “Un motivo de honor inmenso”

El exmandatario compartió en entrevista con Westcol anécdotas familiares y elogió el papel de las artistas colombianas como referentes para la juventud

Álvaro Uribe afirmó que una sobrina suya quiere ser como Karol G y habló del éxito de Shakira en Copacabana: “Un motivo de honor inmenso”

La Oficina de Operaciones de Detención y Deportación arresta a un nicaragüense vinculado a la MS-13 en San Francisco

Un hombre originario de Nicaragua enfrenta un proceso de deportación por sus vínculos con una red delictiva internacional y por sentencias relacionadas con delitos de narcóticos y sustracción de vehículos, según confirmó la agencia federal estadounidense

La Oficina de Operaciones de Detención y Deportación arresta a un nicaragüense vinculado a la MS-13 en San Francisco

Incendio arrasa fábrica de mangueras en Culiacán y deja pérdidas totales

El siniestro movilizó a todos los cuerpos de emergencia de la ciudad y obligó al cierre de vías

Incendio arrasa fábrica de mangueras en Culiacán y deja pérdidas totales

Juez ordenó la libertad de Sandra Ortiz por vencimiento de términos en proceso judicial por el escándalo de corrupción en la Ungrd

La exconsejera presidencial estaba detenida desde diciembre de 2024 por su presunto vínculo con el caso de corrupción en la Unidad Nacional de Gestión del Riesgo de Desastres

Juez ordenó la libertad de Sandra Ortiz por vencimiento de términos en proceso judicial por el escándalo de corrupción en la Ungrd

Hantavirus, última hora del brote en el crucero MV Hondius, en directo | Sanidad confirma: los análisis genéticos demuestran que el virus es variante Andes y que no tiene “mutaciones relevantes”

Los 28 pasajeros del MV Hondius que quedan por desembarcar —seis viajeros, 20 tripulantes y dos médicos de la OMS— viajarán en dos aviones con destino a Países Bajos

Hantavirus, última hora del brote en el crucero MV Hondius, en directo |  Sanidad confirma: los análisis genéticos demuestran que el virus es variante Andes y que no tiene “mutaciones relevantes”