Впечатляющая программа искусственного интеллекта, воссоздающая лица из аудио

Speech2Face - это исследование, которое показало, что узнать, как выглядит лицо человека, можно с помощью небольшого фрагмента его голоса.

Guardar

Технологии продолжают стремительно расти, опираясь на несколько областей для изучения новых возможностей и функций. Один из них заключается в том, чтобы иметь возможность «реконструировать» лицо человека с помощью фрагмента голоса.

Исследование Speech2Face, представленное в 2019 году на конференции Vision and Recognition Patterns, показало, что искусственный интеллект (ИИ) может расшифровать внешность человека с помощью коротких аудиофрагментов.

В статье поясняется, что целью исследователей Тэ Хён Он, Тали Декел, Чангила Кима, Инбара Моссери, Уильяма Т. Фримена и Майкла Рубинштейна из исследовательской и научной программы Массачусетского технологического института является не идентичная реконструкция лиц людей, а создание изображения с физическими характеристиками, связанными с анализируемый звук.

Для этого они использовали, спроектировали и обучили глубокую нейросеть, которая анализировала миллионы видео, снятых с YouTube, где люди разговаривают. Во время обучения модель научилась соотносить голоса с лицами, что позволило ей создавать изображения с физическими характеристиками, похожими на говорящих, включая возраст, пол и этническую принадлежность.

Infobae

Тренинг проводился под наблюдением и с использованием совпадения лиц и голосов интернет-видео, без необходимости моделирования подробных физических характеристик лица.

Они уточнили, что, поскольку в этом исследовании могут быть аспекты, чувствительные к этнической принадлежности, а также к конфиденциальности, к воссозданию лиц не было добавлено никаких конкретных физических аспектов, и они гарантируют, что, как и любая другая система машинного обучения, оно улучшается с течением времени, поскольку при каждом использовании расширяет библиотеку знаний.

Хотя тесты показали, что Speech2Face имеет большое количество совпадений между лицами и голосами, он также имел некоторые недостатки, когда этническая принадлежность, возраст или пол не соответствовали используемой выборке голоса.

Infobae

Модель предназначена для представления статистических корреляций, существующих между чертами лица и голосом. Следует помнить, что искусственный интеллект учился через видеоролики YouTube, которые не представляют реальную выборку населения в мире, например, на некоторых языках он показывает расхождения с данными обучения.

В этом смысле само исследование рекомендует в конце своих результатов тем, кто решит исследовать и модернизировать систему, рассмотреть более широкую выборку людей и голосов, чтобы машинное обучение имело более широкий репертуар сопоставления и воссоздания лиц.

Программа также смогла воссоздать голос в мультфильмах, которые также имеют невероятное сходство с голосами анализируемых аудиозаписей.

Поскольку эта технология также может быть использована в злонамеренных целях, воссоздание лица остается максимально близким к человеку и не дает полных лиц, поскольку это может быть проблемой для частной жизни людей. Тем не менее, было удивительно, что технология может сделать из аудиообразцов.

ПРОДОЛЖАЙТЕ ЧИТАТЬ:

Más Noticias

Donald Trump anunció que Israel y Hamas llegaron a un acuerdo para un intercambio de rehenes por prisioneros

Se trata de la primera fase del plan presentado por el presidente estadounidense que contempla el regreso a casa de los 47 secuestrados por los terroristas y la liberación de una lista de palestinos encarcelados en territorio israelí

Donald Trump anunció que Israel

Deuda colombiana que querían pagar los árabes y Pablo Escobar es cada vez más alta: Gustavo Petro la llevó a otro récord

El crecimiento de las obligaciones internacionales refleja una tendencia ascendente desde el año 2000, con especial énfasis en los últimos cinco años

Deuda colombiana que querían pagar

Representante que supo acompañar a James Rodríguez, Cristiano Ronaldo y Falcao García guiará a figura de la Liga Betplay

El poderoso empresario portugués fijó sus ojos en una de las grandes promesas del fútbol profesional colombiano, que ya es uno de los delanteros más destacados del torneo local

Representante que supo acompañar a

Tripulante peruana de la Flotilla Global Sumud narra intercepción de barco hacia Gaza: “Nos tuvieron 12 horas en el suelo”

La embarcación ‘Adara’ fue uno de los barcos de la Flotilla Global Sumud interceptados por fuerzas israelíes en el Mediterráneo. La misión buscaba romper el bloqueo a Gaza y entregar ayuda humanitaria a la población de la Franja

Tripulante peruana de la Flotilla

Gustavo Salcedo vigilaba e intervenía los teléfonos de Christian Rodríguez y Maju Mantilla mientras era ampayado con otra mujer en el Westin

El empresario fue grabado admitiendo que rastreó los teléfonos y autos de su esposa y productor, mientras ocultaba su propio ampay con Mariana de la Vega.

Gustavo Salcedo vigilaba e intervenía