Hacemos Periodismo

Guardar

A tecnologia continua a crescer aos trancos e barrancos, aproveitando várias áreas para explorar novos recursos e funções. Uma delas é ser capaz de “reconstruir” o rosto de uma pessoa através de um fragmento de voz.

O estudo Speech2Face apresentado em 2019 em uma conferência Vision and Recognition Patterns mostrou que uma Inteligência Artificial (IA) pode decifrar a aparência de uma pessoa por meio de segmentos curtos de áudio.

O artigo explica que o objetivo dos pesquisadores Tae-Hyun On, Tali Dekel, Changil Kim, Inbar Mosseri, William T. Freeman e Michael Rubinstein do Programa de Pesquisa e Ciência do MIT não é reconstruir o rosto das pessoas de forma idêntica, mas fazer uma imagem com as características físicas que estão relacionadas com o áudio analisado.

Para conseguir isso, eles usaram, projetaram e treinaram uma rede neural profunda que analisou milhões de vídeos tirados do YouTube onde as pessoas estão conversando. Durante o treinamento, o modelo aprendeu a correlacionar vozes com rostos, permitindo produzir imagens com atributos físicos semelhantes aos falantes, incluindo idade, gênero e etnia.

O treinamento foi realizado sob supervisão e utilizando a concordância dos rostos e vozes dos vídeos da Internet, sem a necessidade de modelar características físicas detalhadas do rosto.

Eles detalharam que, como este estudo pode ter aspectos sensíveis à etnia, bem como à privacidade, é que nenhum aspecto físico específico foi adicionado à recriação de rostos e garantem que, como qualquer outro sistema de aprendizado de máquina, melhora com o tempo, pois em cada uso aumenta sua biblioteca de conhecimento.

Embora os testes mostrados mostrem que o Speech2Face tem um alto número de coincidências entre rostos e vozes, ele também apresentou algumas falhas, onde etnia, idade ou sexo não correspondiam à amostra de voz usada.

O modelo é projetado para apresentar correlações estatísticas que existem entre as características faciais com a voz. Deve-se lembrar que a IA aprendeu por meio de vídeos do YouTube, que não representam uma amostra real da população no mundo, por exemplo, em alguns idiomas mostra discrepâncias com os dados de treinamento.

Nesse sentido, o próprio estudo recomenda, ao final de seus resultados, que aqueles que decidem explorar e modernizar o sistema considerem uma amostra mais ampla de pessoas e vozes para que o aprendizado de máquina tenha um repertório mais amplo de correspondência e recriação de rostos.

O programa também foi capaz de recriar a voz em desenhos animados, que também têm uma semelhança incrível com as vozes dos áudios analisados.

Como essa tecnologia também poderia ser usada para fins maliciosos, a recriação do rosto só permanece o mais próximo da pessoa e não dá rostos completos, pois isso pode ser um problema para a privacidade das pessoas. Ainda assim, tem sido surpreendente o que a tecnologia pode fazer a partir de amostras de áudio.

CONTINUE LENDO:

Cuidado: hackers se fazem passar pelo WeTransfer para roubar informações

eHealth, o que é e por que é o futuro da medicina

Painéis solares que funcionam sem o sol; crie placas que também produzem energia à noite

WhatsApp apresenta 6 reações com emojis para mensagens e mais opções de privacidade

Más Noticias

Avance de ‘Valle Salvaje’ del miércoles 18 de marzo: Pedrito le planta cara a don Hernando y el futuro incierto de José Luis y Victoria

El nuevo capítulo de la serie de RTVE saca a la luz secretos, reproches y decisiones que marcarán un antes y un después

Primer buque hospital construido en Colombia es asegurado para brindar atención en zonas apartadas

Previsora Seguros anunció que respalda la embarcación mediante una póliza que protege la estructura del buque y cubre los riesgos asociados a su operación

Juan Gabriel Rescalvo, psicólogo: “Deja de obsesionarte con lo que no controlas, no se pueden forzar los ritmos de nadie”

El especialista explica desde su experiencia que cuando menos te lo esperas llegan todos los cambios

Un reconocido analista explicó por qué la estrategia militar de Estados Unidos e Israel contra Irán “está funcionando”

Muhanad Seloom argumenta que los críticos miden los costos de la guerra pero ignoran el balance estratégico. Los lanzamientos de misiles iraníes cayeron un 90 por ciento en dos semanas y cada instrumento de poder de Teherán está siendo degradado sistemáticamente

Impressionante programa de Inteligência Artificial que recria rostos de áudios

Speech2Face é um estudo que mostrou que é possível saber como é o rosto de uma pessoa com apenas um pequeno fragmento de sua voz

Más Noticias

Avance de ‘Valle Salvaje’ del miércoles 18 de marzo: Pedrito le planta cara a don Hernando y el futuro incierto de José Luis y Victoria

El nuevo capítulo de la serie de RTVE saca a la luz secretos, reproches y decisiones que marcarán un antes y un después

Primer buque hospital construido en Colombia es asegurado para brindar atención en zonas apartadas

Previsora Seguros anunció que respalda la embarcación mediante una póliza que protege la estructura del buque y cubre los riesgos asociados a su operación

Juan Gabriel Rescalvo, psicólogo: “Deja de obsesionarte con lo que no controlas, no se pueden forzar los ritmos de nadie”

El especialista explica desde su experiencia que cuando menos te lo esperas llegan todos los cambios

Un reconocido analista explicó por qué la estrategia militar de Estados Unidos e Israel contra Irán “está funcionando”

Muhanad Seloom argumenta que los críticos miden los costos de la guerra pero ignoran el balance estratégico. Los lanzamientos de misiles iraníes cayeron un 90 por ciento en dos semanas y cada instrumento de poder de Teherán está siendo degradado sistemáticamente

Resultados Dorado Mañana del último sorteo hoy 17 de marzo del 2026

Este martes se llevó a cabo la jugada matutina más reciente de la lotería. Conoce los números y la combinación ganadora

Temas Relacionados

Más Noticias

Avance de ‘Valle Salvaje’ del miércoles 18 de marzo: Pedrito le planta cara a don Hernando y el futuro incierto de José Luis y Victoria

El nuevo capítulo de la serie de RTVE saca a la luz secretos, reproches y decisiones que marcarán un antes y un después

Primer buque hospital construido en Colombia es asegurado para brindar atención en zonas apartadas

Previsora Seguros anunció que respalda la embarcación mediante una póliza que protege la estructura del buque y cubre los riesgos asociados a su operación

Juan Gabriel Rescalvo, psicólogo: “Deja de obsesionarte con lo que no controlas, no se pueden forzar los ritmos de nadie”

El especialista explica desde su experiencia que cuando menos te lo esperas llegan todos los cambios

Un reconocido analista explicó por qué la estrategia militar de Estados Unidos e Israel contra Irán “está funcionando”

Muhanad Seloom argumenta que los críticos miden los costos de la guerra pero ignoran el balance estratégico. Los lanzamientos de misiles iraníes cayeron un 90 por ciento en dos semanas y cada instrumento de poder de Teherán está siendo degradado sistemáticamente

Resultados Dorado Mañana del último sorteo hoy 17 de marzo del 2026

Este martes se llevó a cabo la jugada matutina más reciente de la lotería. Conoce los números y la combinación ganadora