«Explicar cómo manejan la lengua los hablantes y formalizar ese conocimiento, un reto para los lingüistas»
«Explicar cómo manejan la lengua los hablantes y formalizar ese conocimiento para que pueda ser usado en diversas aplicaciones es hoy un reto para los lingüistas»» ha señalado el miembro de la RAE y director académico del Corpus del Siglo XXI (CORPES), Guillermo Rojo, para abrir el diálogo del panel del VIII CILE que ha coordinado hoy, 30 de marzo, bajo el título «Recursos, herramientas y productos lingüísticos. Repercusiones sobre la industria».
En la sesión, presidida por el vicepresidente de la Academia Ecuatoguineana de la Lengua Española, Julián Bibáng Oyee, han participado también diversos expertos en procesamiento del lenguaje natural como la argentina Laura Alonso Alemany; el chileno afincado en Estados Unidos Ricardo Baeza-Yates; la catalana Núria Bel y el mexicano Gerardo Sierra.
PROCESAMIENTO DEL LENGUAJE
Guillermo Rojo ha propuesto tratar el tema desde tres perspectivas diferentes: por un lado, «la óptica de las Administraciones públicas, atendiendo en especial a su papel como entidades con responsabilidad en la financiación de la producción de recursos de uso general»; por otro, «la perspectiva de los grupos que trabajan en la investigación, desarrollo e innovación en el procesamiento del lenguaje natural», y, en último término, «el enfoque de las conocidas como industrias de la lengua en sus más diversos aspectos».
Como ha señalado Núria Bel, de la Universidad Pompeu Fabra, en un texto que ha leído el coordinador de panel, ante la ausencia de última hora de la investigadora, «cada vez son más frecuentes las noticias de nuevos productos que dicen poder entender lo que decimos o escribimos para ayudarnos en diferentes tareas, desde reservar una mesa, a resumir la opinión de los clientes o traducirlos a nuestro idioma». Sin embargo, tal y como ha explicado, estas aplicaciones de las tecnologías del lenguaje no dependen únicamente de disponer de un algoritmo, «también requieren de datos específicos del idioma en el que se pretende que operen, de colecciones de textos y sus vocabularios, monolingües y multilingües, enriquecidos con metadatos e información lingüística adicional».
APRENDIZAJE AUTOMÁTICO
El enfoque clásico para estas tareas como extraer lemas, identificar los componentes de una frase o reconocer entidades nombradas —ha expuesto Ricado Baeza— usa algoritmos basados en reglas que fallan cuando encuentran ciertos errores ortográficos o gramaticales». De ahí que, gracias al aumento de la cantidad de datos disponibles y de la capacidad de cálculo, como ha explicado, «actualmente se están usando métodos basados en aprendizaje automático que son más efectivos y robustos, particularmente mediante el uso de redes neurales de muchos niveles».
A pesar de los avances, «todavía existen algunas deficiencias a superar», ha manifestado Gerardo Sierra. En su opinión, «falta reforzar la creación y disponibilidad de recursos lingüísticos: lexicones, diccionarios especializados, corpus, ontologías».
Por su parte, Laura Alemany ha hecho hincapié en la importancia de cultivar lo que ha llamado el «círculo virtuoso de relaciones entre la academia y la industria». La profesora de la Universidad de Córdoba ha añadido: «Desde la Universidad ejercemos roles muy diversos en este ecosistema y uno de los más importantes es aportar visión de futuro».
PANEL SIMULTÁNEO
Al mismo tiempo que se trataba del desarrollo e industria de las tecnologías lingüísticas, tenía lugar un debate sobre «Corrección política y lengua», presidido por el académico uruguayo Adolfo Elizaincín, en el que ha participado el académico español Pedro Álvarez de Miranda.
A las 17 horas, en el Teatro san Martín, se celebrará la sesión solemne de clausura. Participarán el secretario general del VIII CILE y director académico del Instituto Cervantes, Richard Bueno Hudson; el secretario general de la Asociación de Academias de la Lengua Española, Francisco Javier Pérez; el presidente de la Academia Argentina de Letras, José Luis Moure, y el Intendente de la Ciudad de Córdoba, Ramón Javier Mestre.
Kommentarer