
El uso de la inteligencia artificial (IA) continúa siendo un debate en cuanto a los límites y las tareas que se le asignan; sin embargo, esta herramienta también ayuda en diferentes ámbitos, como en la preservación de lenguas originarias en México.
En este caso, un grupo de especialistas del Departamento de Ciencias de la Computación del Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas de la UNAM impulsa el uso de tecnologías digitales para evitar la desaparición de estos idiomas, muchos de los cuales ya no cuentan con hablantes activos.
La situación de las lenguas nativas es crítica. México cuenta con 68 lenguas, agrupadas en 11 familias y 364 variantes.
Según datos expuestos por Iván Vladimir Meza Ruiz, investigador de la UNAM, la proporción de hablantes se redujo drásticamente desde 1930, cuando representaba el 15% de la población, hasta 2020, año en el que apenas alcanzaban el 6.2%.

Esta reducción afecta sobre todo a las nuevas generaciones, que casi no practican estos idiomas, mientras que la mayoría de los hablantes actuales son adultos mayores.
En palabras de Meza Ruiz, la inteligencia artificial podría mantener “vivas” las lenguas originarias “aunque sea de manera artificial”, ya que muchas se encuentran al borde de la extinción y carecen de registros suficientes.
La iniciativa se enfrenta a un desafío tecnológico y ético: si bien existen los conocimientos para crear registros digitales masivos, el proceso depende de contar con datos suficientes y de calidad.
Obstáculos para el registro digital
Uno de los retos principales que enfrenta este proyecto es la escasez de datos. Meza Ruiz detalló que la mayoría de los registros disponibles está enfocada en la música y son escasos los que corresponden al habla cotidiana, lo que dificulta el desarrollo de herramientas de inteligencia artificial basadas en ejemplos reales.
Este sesgo limita la representación de los idiomas y, por extensión, la posibilidad de su preservación tecnológica.

Actualmente, el acceso a corpus digitales en lenguas originarias es mínimo. Por ejemplo, según Wikipedia, el náhuatl clásico solo cuenta con 4.272 artículos; el maya yucateco, 1.201; el náhuatl central, 224; el mixteco, 113; el hñahñu, 90; el purépecha, 12; y el mixe del norte, apenas 10. Estas cifras reflejan la brecha existente entre idiomas mayoritarios y las lenguas indígenas en la esfera digital.
El dilema ético y la función social
Meza Ruiz puso sobre la mesa una cuestión ética relevante: muchos textos y documentos en lenguas originarias están protegidos por derechos de autor, lo que complica la captación de datos para uso académico o tecnológico. Esta barrera se suma al deseo de fomentar la ciencia abierta y la colaboración, pero sin vulnerar los derechos morales y patrimoniales de las comunidades.
La digitalización de las lenguas, según el especialista, no solo busca conservar el patrimonio cultural, sino también facilitar el acceso de las comunidades a servicios fundamentales.

La implementación de una estrategia digital permitiría a los hablantes acceder a: salud, justicia, educación y autonomía económica en su propio idioma, además de garantizar la transmisión oral y escrita de su legado.
El siguiente paso, según Meza Ruiz, es crear el ecosistema adecuado para recolectar y procesar los datos necesarios. Solo así será posible conservar digitalmente los idiomas y garantizar que las futuras generaciones tengan acceso a ellos, aunque sea en entornos virtuales o a través de aplicaciones basadas en inteligencia artificial.
Más Noticias
El General Sinuhé Téllez López es nombrado nuevo secretario de Seguridad de Sinaloa
Las autoridades señalaron que el nuevo hombre a cargo cuanta con experiencia en la entidad

Temblor en Guerrero hoy: se registra sismo en Coyuca de Benítez
El temblor sucedió a las 14:22 horas, a una distancia de 63 km de Coyuca de Benítez y tuvo una profundidad de 16.2 km

Hoy No Circula martes: qué autos descansan este 17 de marzo en el Valle de México y de Toluca
Esto es de interés para aquellos que van a conducir en la Ciudad de México y el Estado de México este martes

Temblor hoy 16 de marzo en México: se registró un sismo de magnitud 4.0 en Baja California
Sigue en vivo todas las actualizaciones sobre movimientos telúricos este lunes

Metro CDMX y Metrobús hoy 16 de marzo: línea 8 reanuda circulación tras rescate de persona en vías
Las estaciones San Antonio Abad, Chabacano y Viaducto se mantienen cerradas


