Lingway réalise les premiers outils d'analyse des messages reçus par le Programme KEO
Lingway, société spécialisée dans la conception et le développement d’applications documentaires basées sur les technologies linguistiques, a présenté hier au Centre Français du Commerce Extérieur les outils et les méthodes qu’elle a mis en oeuvre pour l’analyse des messages reçus par le Programme KEO (www.keo.org), l’Oiseau Archéologique du Futur.
Dans le même temps, une première cartographie de contenus a été réalisée à partir d’un échantillon des messages électroniques1 en langue française (Cf. encadré page 3), démontrant ainsi les possibilités d’analyse des outils développés par Lingway.
Conformément à la finalité du projet qui consiste à réaliser une radioscopie de la communauté humaine d’aujourd’hui et à lancer un débat international sur le monde que nous aurions envie de construire ensemble, Lingway a mobilisé ses équipes de linguistes et l’ensemble de son savoir-faire logiciels pour réaliser une analyse multilingue des messages reçus ou disponibles sous forme électronique. Des outils d’analyse linguistique ont ainsi été spécifiquement adaptés pour mieux comprendre ce qui est dit dans ces messages, notamment pour la reconnaissance automatique des noms propres, la catégorisation automatique des thèmes clés et la navigation dans le corpus des messages KEO (Cf. écran ci-dessous – représentation des mots associés à un thème).
Voir la copie d'écran à taille réelle
1 Cette première analyse du contenu des messages du Programme KEO s’appuie
sur un échantillon, réalisé par tirage aléatoire,
de 100 000 messages parvenus par email sur le site web de KEO entre le 1er
janvier 2000 et le 31 décembre 2002. La répartition linguistique
de ces messages est le suivant : anglais 32%, français 25%, espagnol
12%, chinois 6%, autres langues (environ 80) 24%. Sur cet échantillon,
il est intéressant de noter que 56% des messages ont été envoyés
par des internautes de moins de 20 ans. Quand au nombre moyen de mots par message
il est de 174.
De cet échantillon, les ingénieurs et linguistes de Lingway
ont réalisé une analyse des 25 000 messages en langue française
préalablement rendus anonymes. Ce premier travail a pour objectif de
tester les outils et les méthodes nécessaires à terme
pour l’analyse multilingue de l’ensemble du corpus des messages
KEO.
« Le Programme KEO de part l’universalité de son contenu est un extraordinaire champ d’investigation au service de toute la communauté industrielle et technologique de l’ingénierie linguistique. Seules des technologies linguistiques et documentaires de pointes sont capables d’analyser une telle masse d’informations », indique Bernard Normier, PDG de Lingway.
« Analyser nos messages rendus anonymes en reconnaissant à chacun son caractère unique, c’est se donner les moyen d’atteindre une image de la communauté humaine comme nous ne l’avions jamais réalisée jusqu’à présent, c’est voir plus clair entre nous. Le message de l’enfant des bidonvilles est aussi porteur et digne d’intérêt que celui du prix Nobel d’Economie et celui du cadre supérieur aussi révélateur d’une dimension humaine que celui d’un membre d’une tribu de Nouvelle Calédonie », indique Jean-Marc Philippe, créateur du Programme KEO.
Une radiographie des messages accessible à tous
Grâce aux outils de traitement informatique du langage (logiciels d’indexation
et de recherche, de catégorisation des concepts, d’extraction
d’informations, de navigation et de cartographie) adaptés par
Lingway, il sera ainsi possible à terme, après le lancement du
satellite KEO prévu à l’horizon 2006, d’avoir une
radiographie des messages accessibles à tous. Sachez qu’il faudrait à chacun
plus de 10 années consécutives en restant éveillé pour
lire seulement 1 million des messages de KEO à raison d’une minute
par page, sans se souvenir des premiers !
A partir de cette expérience, Lingway coordonnera une équipe
de recherche internationale en linguistique automatique pour traiter toutes
les langues représentées.
Une prochaine communication sur l’analyse des messages reçus en 2003 en français, anglais et espagnol sera communiquée en fin d’année.
Une maquette présentant les outils développés par Lingway pour l’analyse de ce premier échantillon de messages KEO sera consultable prochainement sur les sites www.keo.org et www.lingway.com
Exemple d’analyse des messages et de l’interface linguistique créé par
Lingway
Voir la copie d'écran à taille réelle
Echantillon des messages KEO en français : TOP 20 des personnalités
et des thèmes Les 20 premiers thèmes sont : 1- petits enfants, 2- bonne chance, 3- espèce humaine, 4- planète terre, 5- générations futures, 6- êtres humains, 7- monde de paix, 8- monde meilleur, 9- vie sur la terre, 10- habitants de la terre, 11- petit village, 12- pollution, 13- vie heureuse, 14- monde futur, 15- monde actuel, 16- planète bleue, 17- couche d’ozone, 18- bien-être, 19- New-York, 20- guerre. |
A propos du Programme KEO : www.keo.org
Elu « Projet du XXI ème Siècle » par l’UNESCO, KEO, l’Oiseau Archéologique du Futur, est un satellite destiné à être lancé dans l’espace pour un long vol autour de la planète Terre où il reviendra se poser dans quelque … 50 000 ans pour livrer à nos lointains descendants tous les messages que chacun d’entre nous est invité à lui confier. Outre nos messages, KEO sera aussi porteur d’autres cadeaux archéologiques chargés de symboles et d’informations. Ainsi, chacun sur Terre est invité à envoyer son message (d’une ligne à 4 pages soient 6 000 signes) afin de témoigner de sa vie, de confier ses aspirations, ses révoltes, d’exprimer ses interrogations ou ses croyances, transmettre une parole ou une simple pensée de lui-même.
Dès sa mise en orbite, tous les messages reçus par KEO – rendus anonymes dans leur copie conservée sur Terre – feront l’objet d’analyses linguistiques et sociologiques. Des cartographies de sens et de contenu en résulteront qui nourriront le débat publique en aidant à répondre aux questions : « qui sommes nous ? » et « quel monde plus humain pourrions-nous bâtir ensemble dès aujourd’hui ? ».
Imaginé par Jean-Marc Philippe, artiste et scientifique, KEO est réalisé en dehors de toute influence politique, confessionnelle ou commerciale, le projet KEO est mené par une association Loi 1901 sans but lucratif, de droit français. KEO bénéficie du concours gracieux de ses partenaires qui lui offrent chacun, dans leur cœur de métier, l’ensemble des moyens de sa mise en oeuvre.
A propos de Lingway : www.lingway.com
Créé en septembre 2001 par Bernard Normier, LINGWAY est un éditeur
de logiciels documentaires basés sur l’ingénierie linguistique.
La technologie de Lingway comprend notamment un moteur de recherche en langage naturel, des outils de catégorisation et de codage, des logiciels de structuration XML de documents textuels, et de fonctions d’extraction d’informations et de cartographie documentaire.
Lingway travaille d’ores et déjà sur plusieurs grands projets au niveau européen.
De plus, pour permettre le développement de bases de connaissances spécialisées, Lingway a pour objectif l’ouverture de filiales verticales spécialisées dans certains secteurs d’activité.
Actus RP
Laurent Meggs
01 53 67 36 39
lmeggs@actus.fr
Réalisez votre veille d’entreprise en suivant les annonces de la Bourse
Page affichée mardi 23 décembre 2025 à 4h14m31


