Sábado 23 de Noviembre de 2024

CIENCIA

17 de abril de 2022

"La Inteligencia Artificial puede ayudar a estudiar la lengua"

Asunción Gómez-Pérez es la primera persona con una trayectoria vinculada al área de la Tecnología de la Información y la Computación en ocupar la silla "q" de la Real Academia Española. En diálogo con Télam, contó cuál es la relación entre la informática y lenguaje, tema que investiga hace años.

Por Agustina Ramos

Asunción Gómez-Pérez, la experta en inteligencia artificial y lenguaje nombrada para ocupar la silla "q" de la Real Academia Española.


La experta en inteligencia artificial (IA) y lenguaje Asunción Gómez-Pérez, nombrada para ocupar la silla "q" de la Real Academia Española (RAE), afirmó que "los recursos lingüísticos pueden proporcionar riqueza a las aplicaciones de IA", al tiempo que estas puede ayudar a hacer "más eficaz y eficiente" el estudio de la lengua.

La doctora en Ciencias de la Computación e Inteligencia Artificial es la primera persona que presenta una trayectoria vinculada al área de la Tecnología de la Información y la Computación en ocupar este puesto dentro de la RAE.

La científica nacida en Extremadura, España, se desempeña como vicerrectora de Investigación, Innovación y Doctorado en la Universidad Politécnica de Madrid, donde reside, y dirige el nodo de Innovación Digital en Inteligencia Artificial y Robótica para los Objetivos de Desarrollo Sostenible seleccionado por la Comisión Europea.

Su nombre aparece en la lista del 2 por ciento de científicas y científicos más citados del mundo, publicada en octubre de 2021 por la Universidad de Stanford, y dirigió 106 proyectos de investigación, con cuyos fondos logró mantener el Grupo de Ingeniería Ontológica que fundó.

 
"Los recursos lingüísticos pueden proporcionar riqueza a las aplicaciones de IA pero, al mismo tiempo, las aplicaciones de IA pueden ayudar a los filólogos y a los lexicógrafos a estudiar la lengua para hacer su trabajo más eficaz y más eficiente"Asunción Gómez-Pérez

"Los recursos lingüísticos pueden proporcionar riqueza a las aplicaciones de IA pero, al mismo tiempo, las aplicaciones de IA pueden ayudar a los filólogos y a los lexicógrafos a estudiar la lengua para hacer su trabajo más eficaz y más eficiente", señaló a Télam Gómez-Pérez.

El pleno de la RAE está formado por 46 miembros y cada cual ocupa una "silla" representada por las letras del abecedario, tanto en mayúsculas como en minúsculas, excluyendo las letras v, w, x, y, z, Ñ, W, Y.

El jueves 7 de abril, la catedrática Gómez-Pérez fue nombrada por el pleno de la RAE para ocupar la silla "q", convirtiéndose en la decimocuarta mujer que se desempeña como académica de la institución y una de las siete que están en función.

La silla "q" estaba vacante desde el fallecimiento de Gregorio Salvador el 26 de diciembre de 2020, y la candidatura de Asunción fue presentada por los académicos Luis Mateo Díez, Pedro García Barreno y Salvador Gutiérrez Ordóñez.

 

El pleno de la RAE est formado por 46 miembros y cada cual ocupa una silla representada por las letras del abecedario

El pleno de la RAE está formado por 46 miembros y cada cual ocupa una "silla" representada por las letras del abecedario.


En diálogo con Télam, Gómez-Pérez contó cuál es la relación entre lo que investiga hace años en lo referente a informática y lenguaje.

Télam: ¿Por qué la RAE está interesada en incorporar a una académica del área de la Tecnología de la Información y Comunicación?
Asunción Gómez-Pérez: Hay ahora mismo un proyecto muy importante en España asociado al Plan de Recuperación, Transformación y Resiliencia que ha sido dotado con 1.100 millones de euros para modernizar la economía española. Dentro de esos fondos hay un proyecto que se llama Lengua Española e Inteligencia Artificial (LEIA) que se va a ejecutar desde la Real Academia Española.

Ese proyecto tiene como objetivo que los dispositivos, las máquinas, que hablan o escriben en español, utilicen a la hora de generar los textos un español que sea correcto, teniendo en cuenta todas las especificidades dado que hay expresiones que se pueden utilizar en España que no se utilizan en Latinoamérica o viceversa. El objetivo es que todos estos dispositivos hablen o escriban de forma correcta.

T: ¿Cómo es hoy en día el lenguaje de las máquinas?
A: Cuando nosotros interactuamos con las aplicaciones nos aparece, por ejemplo, la función de autocompletar. ¿Qué es lo que ocurre? Que nosotros vamos escribiendo y el autocompletar nos va sugiriendo una serie de palabras. Muchas veces es muy fácil darle a la sugerencia que nos está proponiendo. Eso a lo mejor nos impide que nosotros podamos elegir otra palabra, es decir, nos va condicionando la comunicación entre personas.

T: ¿Por qué ocurre?
A: Estas aplicaciones utilizan cierto tipo de algoritmos que son capaces de analizar cuáles son las palabras que nosotros normalmente utilizamos cuando escribimos. Entonces si una persona está especializada en un campo, las palabras que le va a sugerir son siempre las mismas. Eso lo que hace al final es empobrecer el vocabulario del ser humano cuando se comunica a través de una máquina, de una aplicación digital.

T: ¿Cómo se puede modificar esta situación?
A: La máquina, por ejemplo, podría proponer un sinónimo, o cuando alguien utiliza una abreviatura podría saber que esa abreviatura equivale a una palabra completa. También proponiendo traducciones entre idiomas mucho más precisas. Eso sería la forma de empezar a introducir cierto tipo de recursos que tiene la Academia del diccionario para enriquecer este tipo de aplicaciones.

T: ¿Cómo fue su camino profesional en esta dirección?
Yo llevo trabajando con palabras desde el inicio de mi carrera profesional, pero expresando las palabras en un lenguaje comunicacional que entiende el ordenador. Si el ordenador entiende el significado de una palabra entonces va a poder posteriormente razonar con esas palabras y con otras. En este sentido, empecé a investigar en el tema de ontologías en los años 90. Cuando hacemos ontología expresamos el significado de la palabra en lenguajes lógicos. Mientras el diccionario está para que lo lean las personas, las ontologías que tienen palabras son para ser utilizadas por las computadoras.

T: ¿Cómo la inteligencia artificial viene a modificar la noción tradicional del lenguaje?
A: La relación entre la lengua y la IA es como si estuviéramos en una carretera de dos direcciones. Por un lado, los recursos lingüísticos pueden proporcionar riqueza a las aplicaciones de IA, pero al mismo tiempo, las aplicaciones de IA pueden ayudar a los filólogos y a los lexicógrafos a estudiar la lengua, para hacer su trabajo más eficaz y más eficiente.

 

Estereotipos reforzados por la automatización del lenguaje

Investigadoras argentinas especializadas en Lingüística y Computación advirtieron que las tecnologías "tienden a unificar todo en un lenguaje estándar" y refuerzan muchas veces estereotipos o prejuicios vinculados al género, el capacitismo y la aporofobia.

"Las tecnologías, las automatizaciones en general, lo que hacen es amplificar enormemente estereotipos de formas muy sutiles. Si no tenemos un ojo entrenado no lo vamos a ver porque reproducen algo que nos resulta natural", dijo a Télam Laura Alonso Alemany, doctora en Lingüística por la Universidad de Barcelona y profesora de Computación en la Universidad Nacional de Córdoba (UNC).

En este sentido, destacó que en la automatización del lenguaje se evidencian estereotipos asociados al capacitismo (una forma de discriminación contra personas con discapacidad) y la aporofobia (aversión hacia las personas en situación de pobreza) que "nos condicionan al comunicarnos".

También se refuerzan los estereotipos de género.

Alemany agregó que cuando se traduce del inglés, que es una lengua sin género, una palabra como nurse "sistemáticamente se traduce como enfermera" y doctor, "como doctor en masculino", lo cual "claramente nos está condicionando a pensar que lo normal es que las enfermeras sean mujeres y los doctores sean hombres".

Otro de los desafíos que presenta la automatización del lenguaje es "el desbalance de poder entre lenguas", advirtió a Télam Luciana Benotti, doctora en Ciencias de la Computación con especialidad en Lingüística Computacional por la Universidad de Nancy.

"Las lenguas que en este momento tienen mayor desarrollo tecnológico son el inglés y en esta última década el chino. Hay otros lenguajes como el español que tienen mucho menos desarrollo, no proporcional a la cantidad de hablantes que tiene y tampoco considera las variaciones regionales", detalló.

Estas tecnologías "tienden a unificar todo en un lenguaje estándar y a considerar incorrecto otras variaciones", lo que tiene un correlato con la desaparición de lenguas minoritarias, añadió.

Además, necesitan muchos datos digitalizados del lenguaje en esas distintas lenguas para poder funcionar. "Entonces lenguas que tienen poco registro, como por ejemplo lenguas nativas del continente americano -mapuche, guaraní-, no tienen soporte de este tipo de tecnologías", explicó Benotti.

Con respecto al panorama en el país de los estudios sobre procesamiento del lenguaje natural, conocido como lingüística computacional, las investigadoras resaltaron la necesidad de una mayor financiación, inversión y formación.

"En el país no hay incentivos para desarrollar esta área. Las becas de doctorado que paga Conicet para personas formadas en computación son imposibles de competir con las oportunidades que tienen estos estudiantes en el exterior o en la industria", argumentó Benotti.

Otro problema es la menor participación de mujeres en las investigaciones de este área y la aún más escasa presencia de personas latinoamericanas.

COMPARTIR: