SAMAR
Analyse multimédia en arabe
Samar est un outil permettant d'extraire des connaissances en langue arabe, de transcrire la parole et de traduire automatiquement la transcription audio en arabe vers le français et/ou l'anglais.
Le projet SAMAR a développé une plateforme de traitement multimédia en langue arabe et de mener des expérimentations sur les dépêches arabes produites par l’AFP ainsi que sur des données radio/télévisées en langue arabe.
La plateforme Samar a permis d'annoter en arabe à un niveau similaire à ce que l'on obtient avec des outils de traitement automatique du language en anglais et en français. Avec cette plateforme, on peut catégoriser (selon le plan IPTC) les documents à la volée, transcrire les bandes son des vidéos, et proposer une traduction automatique à la volée des textes de l’arabe vers l’anglais et le français.
Projet financé par le Fonds unique interministériel
et labellisé par le pôle de compétitivité Cap Digital.