Actualmente los modelos de inteligencia artificial son capaces de generar respuestas en segundos, traducir textos en tiempo real y ofrecer asistencia personalizada. No obstante, millones de hablantes de lenguas indígenas siguen fuera del mapa digital.
Frente a esta brecha, una reciente investigación planteó una pregunta crucial: ¿puede la IA convertirse en aliada de la preservación y revitalización de las lenguas indígenas en América Latina?
Es importar que el estudio llamado “El desempeño de la inteligencia artificial en el uso de lenguas indígenas americanas”, es resultado de una colaboración entre LLYC, BID Lab (la unidad de innovación del Banco Interamericano de Desarrollo) y Microsoft.
El documento no solo diagnostica los desafíos actuales, sino que también traza una hoja de ruta para que las tecnologías emergentes, como la IA generativa, sean verdaderamente inclusivas y culturalmente representativas.
Un escenario desigual
(LLYC)
El estudio examinó cómo responden los sistemas de IA generativa a preguntas formuladas en siete lenguas indígenas.
Los resultados fueron contundentes. Si bien el 54 por ciento de las preguntas obtuvo respuestas aparentemente correctas, estas eran, en promedio, cuatro veces más breves que las generadas en español. Peor aún, la calidad de comprensión y expresión fue calificada con menos de 3 sobre 10.
A esto se suma un problema de fondo: el sesgo cultural. Incluso cuando se formulan preguntas en lenguas indígenas, los sistemas tienden a ofrecer respuestas basadas en referentes occidentales, omitiendo o distorsionando elementos culturales propios.
Esta desviación no es trivial: pone en riesgo la autenticidad de las representaciones culturales y lingüísticas en los espacios digitales.
Las lenguas en peligro
(ONIC)
En Colombia, por ejemplo, se hablan 70 lenguas: además del castellano, 65 son indígenas, 2 criollas (el palenquero de San Basilio y el creole de San Andrés y Providencia), una romaní y la lengua de señas colombiana.
Sin embargo, según datos de la ONIC, el 40 por ciento de estas lenguas está en riesgo de desaparecer. Esta amenaza no solo implica la pérdida de vocabulario, sino también de saberes ancestrales, prácticas medicinales, conocimientos sobre el medio ambiente y formas únicas de entender el mundo.
El informe identifica con claridad que uno de los factores determinantes en el rendimiento de la IA en una lengua es el volumen de datos digitales disponibles en ese idioma.
De hecho, existe una correlación del 91 por ciento entre el número de entradas en Wikipedia y la calidad del desempeño de los modelos de IA en esa lengua. Es decir, sin datos, no hay IA inclusiva.
La IA como vehículo para cerrar brechas
(Pexels)
Frente a este panorama, el informe propone 21 estrategias para revertir el aislamiento digital de las comunidades indígenas.
Estas se agrupan en tres ejes: aumentar los datos disponibles en lenguas originarias, desarrollar tecnologías habilitadoras y reforzar la presencia de estas lenguas en el entorno digital.
Entre las iniciativas destacadas se encuentra el impulso a tecnologías de traducción automática y sistemas de voz a texto, fundamentales para digitalizar lenguas con fuerte tradición oral.
También se plantea el desarrollo de asistentes virtuales en lenguas indígenas, la creación de foros temáticos digitales, y el fortalecimiento de la conectividad y alfabetización digital en estas comunidades.
Las propuestas no se limitan al ámbito tecnológico. También apuntan a aspectos culturales y sociales: promover creadores de contenido en lenguas indígenas, conservar archivos físicos mediante su digitalización y avanzar hacia estándares lingüísticos que, sin eliminar la diversidad dialectal, faciliten la producción de herramientas digitales.
El riesgo de no actuar
La oportunidad que representa la IA es grande, pero también lo es el riesgo de no intervenir a tiempo.
Según el estudio, una IA que no comprenda ni responda adecuadamente en lenguas indígenas puede reforzar la exclusión social, sobre todo en comunidades donde aún persisten altas tasas de monolingüismo y analfabetismo.
Esto tiene implicaciones concretas. En regiones quechuas o guaraníes, por ejemplo, donde los índices de mortalidad infantil son elevados, la telemedicina apoyada por IA podría mejorar significativamente la atención sanitaria.
Del mismo modo, si los portales gubernamentales integran IA multilingüe, los pueblos indígenas podrían acceder sin intermediarios a trámites, subsidios y programas estatales.
No se trata únicamente de preservar lenguas por razones patrimoniales, sino de garantizar que las comunidades indígenas puedan participar activamente del desarrollo económico, educativo y tecnológico que la IA está generando.
Según estimaciones, la IA aportará el 3,5 por ciento del PIB mundial en 2030 y transformará profundamente sectores como el empleo y la educación. Si las lenguas indígenas no están presentes en estos sistemas, sus hablantes corren el riesgo de quedar aún más rezagados.
Un camino posible
(ONU)
El informe también reconoce que ningún actor puede abordar esta transformación en solitario. Las alianzas entre gobiernos, sector privado, comunidades locales y organismos multilaterales serán fundamentales.
Iniciativas de empresas como Microsoft, Google o BBVA, que ya han incorporado lenguas indígenas en sus productos y servicios, demuestran que hay voluntad y posibilidad de avanzar.
Para Adolfo Corujo, CEO de Marketing Solutions en LLYC, este es un punto de partida: “Para que la inteligencia artificial sea verdaderamente inclusiva a nivel global, debe comprender y adaptarse a los distintos contextos lingüísticos y culturales”.
Desde Microsoft, Daniel Korn coincide: “Nuestro objetivo es poner a las personas primero. Nos comprometemos a colaborar para cerrar las brechas identificadas”.
Y César Buenadicha, de BID Lab, lo resume con claridad: “Este estudio nos permite identificar brechas y oportunidades para avanzar hacia tecnologías más accesibles y relevantes para nuestras comunidades”.
Ver 0 comentarios