Вражаюча програма штучного інтелекту, яка відтворює обличчя з аудіо

Speeech2Face - це дослідження, яке показало, що можна дізнатися, як виглядає обличчя людини лише невеликим фрагментом його голосу

Guardar

Технологія продовжує зростати семимильними кроками, спираючись на кілька областей для вивчення нових можливостей і функцій. Одна з них - вміти «реконструювати» обличчя людини через фрагмент голосу.

Дослідження Speech2Face ,представлене в 2019 році на конференції Vision and Recovition Patterns, показало, що Штучний інтелект (AI) можерозшифрувати зовнішність людини за допомогою коротких аудіосегментів.

У статті пояснюється, що метою дослідників Те-Хён Он, Талі Декель, Чангіля Кіма, ІнбарМосері, Вільяма Фрімена та Майкла Рубінштейна програми досліджень і науки MIT є не реконструкція обличчя людей однаково, а зробити образ з фізичними характеристиками, які пов'язані з проаналізовано аудіо.

Щоб досягти цього, вони використовували, розробили та навчили глибоку нейронну мережу , яка проаналізувала мільйони відео, знятих з YouTube, де люди розмовляють. Під час навчання модель навчилася співвідносити голоси з обличчями, дозволяючи створювати зображення з фізичними ознаками, схожими на ораторів, включаючи вік, стать та етнічну приналежність.

Infobae

Тренінг проводився під наглядом та з використанням узгодження облич та голосів інтернет-відео, без необхідності моделювати детальні фізичні характеристики обличчя.

Вони детально розповіли, що оскільки це дослідження може мати аспекти, чутливі до етнічної приналежності, а також приватності, це те, що до відтворення облич не додано жодних конкретних фізичних аспектів, і вони запевняють, що, як і будь-яка інша системамашинного навчання, вона з часом покращується, оскільки при кожному використанні збільшує свою бібліотеку знань.

Хоча показані тести показують, що Speeech2Face має велику кількість збігів між обличчями та голосами, він також мав деякі недоліки, де етнічна приналежність, вік чи стать не відповідали використовуваному вибірці голосу.

Infobae

Модель призначена для представлення статистичних кореляцій, які існують між рисами обличчя з голосом. Слід пам'ятати, що AI вивчили через відео YouTube, які не представляють реальної вибірки населення в світі, наприклад, в деяких мовах він показує розбіжності з даними навчання.

У цьому сенсі саме дослідження рекомендує наприкінці своїх результатів, щоб ті, хто вирішив дослідити та модернізувати систему, розглянути ширший вибірку людей та голосів, щоб машинне навчання мало ширший репертуар відповідності та відтворення облич.

Програма також змогла відтворити голос у мультфільмах, які також мають неймовірну схожість з голосами проаналізованих аудіо.

Оскільки ця технологія також може бути використана для зловмисних цілей, відтворення обличчя залишається максимально наближеним до людини і не дає повних облич, оскільки це може бути проблемою для конфіденційності людей. Тим не менш, дивно, що технологія може зробити з аудіо зразків.

ПРОДОВЖУЙТЕЧИТАТИ:

Más Noticias

Más de 300 muertos por las lluvias torrenciales e inundaciones repentinas en el norte de Pakistán

Sólo en la región de Jíber-Pajtunjua se han confirmado ya 321 muertes, según la Autoridad Nacional para la Gestión de Desastres, que tiene registrados también doce fallecidos en Gilgit-Baltistán y once más en la Cachemira paquistaní

Más de 300 muertos por

¿Qué tan necesarias son las metodologías ágiles en las empresas peruanas?

Las metodologías ágiles avanzan en empresas peruanas, pero su adopción enfrenta resistencia y dificultades. La clave está en adaptar sus principios según el tamaño, contexto y necesidades específicas de cada organización

¿Qué tan necesarias son las

Dónde ver Alianza Lima vs ADT HOY: canal tv online del partido por fecha 6 del Torneo Clausura de la Liga 1 2025

Sin Paolo Guerrero, los ‘blanquiazules’ buscarán cerrar una semana inolvidable frente el ‘vendaval celeste’ en Matute. Conoce las señales disponibles para vibrante cotejo

Dónde ver Alianza Lima vs

Dónde ver Sporting Cristal vs Deportivo Binacional HOY: canal tv online del partido por fecha 6 del Torneo Clausura de la Liga 1 2025

Los ‘cerveceros’ saldrán con la misión de mantener el liderato y su invicto frente el ‘poderoso del sur’ en Juliaca. Entérate cómo sintonizar el crucial choque

Dónde ver Sporting Cristal vs

Claudio Pizarro representó a Bayern Múnich en la final de la Supercopa de Alemania: apareció como leyenda cargando la Bundesliga

Acompañado de un ídolo del Stuttgart, rival por la definición del nuevo título de la temporada 2025/26, el ‘Bombardero de los Andes’ se robó toda la atención por su condición de mito muniqués

Claudio Pizarro representó a Bayern