Впечатляющая программа искусственного интеллекта, воссоздающая лица из аудио

Speech2Face - это исследование, которое показало, что узнать, как выглядит лицо человека, можно с помощью небольшого фрагмента его голоса.

Guardar

Технологии продолжают стремительно расти, опираясь на несколько областей для изучения новых возможностей и функций. Один из них заключается в том, чтобы иметь возможность «реконструировать» лицо человека с помощью фрагмента голоса.

Исследование Speech2Face, представленное в 2019 году на конференции Vision and Recognition Patterns, показало, что искусственный интеллект (ИИ) может расшифровать внешность человека с помощью коротких аудиофрагментов.

В статье поясняется, что целью исследователей Тэ Хён Он, Тали Декел, Чангила Кима, Инбара Моссери, Уильяма Т. Фримена и Майкла Рубинштейна из исследовательской и научной программы Массачусетского технологического института является не идентичная реконструкция лиц людей, а создание изображения с физическими характеристиками, связанными с анализируемый звук.

Для этого они использовали, спроектировали и обучили глубокую нейросеть, которая анализировала миллионы видео, снятых с YouTube, где люди разговаривают. Во время обучения модель научилась соотносить голоса с лицами, что позволило ей создавать изображения с физическими характеристиками, похожими на говорящих, включая возраст, пол и этническую принадлежность.

Infobae

Тренинг проводился под наблюдением и с использованием совпадения лиц и голосов интернет-видео, без необходимости моделирования подробных физических характеристик лица.

Они уточнили, что, поскольку в этом исследовании могут быть аспекты, чувствительные к этнической принадлежности, а также к конфиденциальности, к воссозданию лиц не было добавлено никаких конкретных физических аспектов, и они гарантируют, что, как и любая другая система машинного обучения, оно улучшается с течением времени, поскольку при каждом использовании расширяет библиотеку знаний.

Хотя тесты показали, что Speech2Face имеет большое количество совпадений между лицами и голосами, он также имел некоторые недостатки, когда этническая принадлежность, возраст или пол не соответствовали используемой выборке голоса.

Infobae

Модель предназначена для представления статистических корреляций, существующих между чертами лица и голосом. Следует помнить, что искусственный интеллект учился через видеоролики YouTube, которые не представляют реальную выборку населения в мире, например, на некоторых языках он показывает расхождения с данными обучения.

В этом смысле само исследование рекомендует в конце своих результатов тем, кто решит исследовать и модернизировать систему, рассмотреть более широкую выборку людей и голосов, чтобы машинное обучение имело более широкий репертуар сопоставления и воссоздания лиц.

Программа также смогла воссоздать голос в мультфильмах, которые также имеют невероятное сходство с голосами анализируемых аудиозаписей.

Поскольку эта технология также может быть использована в злонамеренных целях, воссоздание лица остается максимально близким к человеку и не дает полных лиц, поскольку это может быть проблемой для частной жизни людей. Тем не менее, было удивительно, что технология может сделать из аудиообразцов.

ПРОДОЛЖАЙТЕ ЧИТАТЬ:

Más Noticias

Colombia se está quedando sin esmeraldas por falta de inversión científica: Acodes habló sobre el futuro de la piedra preciosa

En entrevista con Infobae Colombia, Guillermo Galvis Morales indicó que la disminución en el comercio exterior, sumada a retos geológicos, impulsa al sector a plantear estrategias para sostenerse en el mercado

Colombia se está quedando sin

La Justicia rechaza una indemnización a una profesora que sufrió la torsión de varios dedos mientras separaba a dos alumnos que estaban peleando

A juicio del tribunal, el centro contaba con un plan de evaluación de riesgos y había adoptado medidas razonables dentro de lo exigible legalmente, sin que pudiera imponérsele la obligación de prever y neutralizar cualquier episodio puntual de violencia entre alumnos

La Justicia rechaza una indemnización

Contaminación por residuos: un peligro invisible que amenaza a los bogotanos con infecciones digestivas y enfermedades respiratorias

Un médico especialista en salud pública y en epidemiología y una psicóloga clínica contaron a Infobae Colombia cómo este flagelo afectaría a los capitalinos

Contaminación por residuos: un peligro

Machu Picchu vuelve a liderar el turismo mundial tras ser elegida la principal atracción turística del planeta en 2025

La ciudadela inca fue distinguida por los World Travel Awards, superando a destinos icónicos de Asia, Europa, África y América

Machu Picchu vuelve a liderar

Cómo es ser ‘cotero’ en Corabastos en Bogotá: largas jornadas, bajos ingresos y la salud en peligro

Miles de trabajadores cargan y distribuyen alimentos en la central mayorista, enfrentando largas jornadas, bajos ingresos y graves riesgos para la salud, según testimonios recogidos por Infobae Colombia

Cómo es ser ‘cotero’ en