EDyLex

Anotación semántica

Edylex mejora la anotación semántica de documentos para el tratamiento lingüístico y la transcripción automática de audio gracias a la detección de palabras nuevas (sustantivos propios, neologismos...).

 

 

Se crean permanentemente nuevas palabas y nuevos usos. ¿Cómo detectar una palabra o un nombre desconocido en un texto o en un flujo de audio? ¿Como atribuirle una fonética, una categoría, unas propiedades sintácticas, un lugar en una red semántica?

 

Para contestar a estas preguntas, el proyecto EDylex experimentó, con los contenidos de AFP, todas las posibilidades de enriquecimiento dinámico de los léxicos utilizados por las herramientas de proceso automático de la lengua. Con una producción diaria de 5.000 noticias en 6 idiomas (francés, inglés, español, alemán, portugués y árabe), AFP constituye un terreno ideal para probar soluciones de análisis lingüística multimodal y multilingüe capaces de enriquecer de forma dinámica sus propios modelos de lenguaje y léxicos.

 

 

El objetivo principal de los métodos y herramientas desarrollados en el proyecto EDyLex fue mejorar la anotación semi-automática de los documentos así como la transcripción de las pistas audio de los videos.

 

 

     SABER MÁS     

 

 

Proyecto financiado por la Agencia Nacional de Investigación francesa (ANR).

 

 

Nuestros socios