You are here

EDyLex

Descubra

  • papyrus

    SCRIBO

    Algoritmos y herramientas colaborativas para extraer conocimientos de textos e imágenes.

  • papyrus

    SAMAR

    Plataforma de tratamiento multimedia en lengua árabe

  • papyrus

    Papyrus

    Una biblioteca digital dinámica

Enriquecimiento dinámico de recursos lexicales multilingües
2 fotos

Proyecto financiado por la Agencia Nacional de la Investigación (ANR)

Se van creando de manera permanente nuevas palabas y nuevos usos. ¿Cómo detectar una palabra o un nombre desconocido en un texto o un flujo de audio para mejorar su anotación? ¿Como atribuirle una fonética, una categoría, unas propiedades sintácticas, un lugar en una red semántica?

Para contestar a estas preguntas, el proyecto  EDylex tiene por objetivo experimentar sobre los contenidos de AFP todas las posibilidades de enriquecimiento dinámico de los léxicos utilizados por las herramientas de proceso automático de la lengua.
Con una producción diaria de 5000 noticias en seis idiomas (francés, inglés, español, alemán, portugués y árabe) , AFP constituye un terreno ideal para probar soluciones de análisis lingüística multimodal y multilingüe capaces de enriquecer de forma dinámica sus propios modelos de lenguaje y léxicos.

El consorcio EDyLex está dirigido por el laboratorio Paris 7 Inria Alpage, especializado en el desarrollo de software para analizar textos y recursos asociados. Está también formado por dos grandes laboratorios de lingüística informática el LIF y el LIMSI, y tres empresas: Vocapia Research (investigación industrial en el tratamiento del discurso), Syllabs (Ingeniería lingüística) y AFP como socio usuario.

 

El objetivo principal de los métodos y herramientas desarrollados en el proyecto EDyLex es el de mejorar la anotación semi-automática de los documentos así como la transcripción de las pistas audio de los videos.

 

logo du financeur ANR

 

Contacto AFP

¿Desea compartir una información, un comentario? Escríbanos a…