“La lengua española tiene un reto tremendo por delante. Es necesario que entre todos coloquemos al español donde se merece, también en el mundo digital”. Con este llamamiento, José María Álvarez-Pallete, presidente de Telefónica, ha urgido a desarrollar inteligencia artificial basada en la lengua española. Lo ha hecho durante su participación en el VIII Congreso de la Lengua que se celebra en Córdoba, Argentina, desde hoy y hasta el 30 de marzo.
También ha instado a “entender cómo se está fraguando la lengua sintética con la que ya nos relacionamos” cuando preguntamos al asistente de voz las noticias del día, el tiempo, la información del tráfico, el resultado de un partido de fútbol, al usar las aplicaciones de mensajería, o al traducir textos usando traductores digitales. José María Álvarez-Pallete ha señalado que “urge hacerlo desarrollando inteligencia artificial basada en nuestra lengua, como Aura de Telefónica”.
El presidente de Telefónica ha explicado que, tras el chino, el español ocupa la segunda posición por importancia. Hablado por 480 millones de personas como primera lengua, supera en un veinte por ciento en número de hablantes al inglés. Sin embargo, al revisar cuál es el idioma en contenidos digitales “el español cae a la cuarta posición y el inglés sube a la primera, con un peso diez veces mayor que el de nuestro idioma”, ha señalado.
Por otro lado, ha indicado que “nuestra lengua está además expuesta a otros riesgos”. El porqué de este fenómeno lo encontramos en los datos con los que aprende a hablar una inteligencia artificial:
Cuanto menos precisos, más erróneos o menos relevantes sean, más errores, limitaciones o incluso sesgos se incorporarán en el lenguaje sintético. Esto supone una amenaza para el futuro de nuestra lengua que no podemos ignorar si queremos asegurar el uso del español por futuras generaciones.
Los errores del lenguaje se extienden a gran velocidad
El presidente de Telefónica ha analizado también cómo los errores del lenguaje se extienden a gran velocidad y cómo la inteligencia artificial aprende de ellos. Ha utilizado ejemplos como cocreta, que aparece en casi ochenta mil referencias de búsquedas; el uso erróneo del imperativo del verbo decir, decirlo, que arroja más de dos millones de resultados, mientras que su forma correcta, decidlo, muestra algo más de tres mil. Vocablos de uso menos habitual, desaparecen o arrojan resultados residuales. Las abreviaturas e imprecisiones al usar aplicaciones de mensajería popularizan el uso de incorrecciones ortográficas o gramaticales.
“Los sesgos culturales de género están presentes en las búsquedas”, ha señalado José María Álvarez-Pallete. Alguno de los ejemplos que ha utilizado: si un usuario escribe surgeon en inglés, el resultado habitual del traductor es cirujano, en masculino; si el usuario escribe nurse, el resultado será enfermera, en femenino; si teclea engineer, aparece ingeniero, en masculino y si escribe nanny, el resultado será niñera, en femenino.
Respecto al impacto que tienen los procesadores de texto más comunes en la configuración del nuevo lenguaje sintético y su impacto en el uso correcto de la lengua, ha subrayado que muchos de estos procesadores “fallan al reconocer palabras correctas” y, además, cuando esto sucede, “proponen corregirlas y sustituirlas, dando lugar así a un empobrecimiento y adelgazamiento del léxico, y este es el momento de abordarlo, ya que en los próximos años cientos de millones de máquinas hablarán español”.
Por último, ha subrayado el papel esencial de la Academia y ha recordado que “el cambio de época requiere nuevas reglas y las nuevas reglas traen nuevas maneras de abordar los problemas”. El presidente de Telefónica ha insistido en que “la lengua sintética aprende y tenemos herramientas, conocimiento y expertos para enseñarla como es debido”.