vendredi 20 décembre 2013

A0435 Les coréférences, exemple de la complexité du langage naturel


Une coréférence, c'est quand un terme  est là pour en désigner un autre (ils font référence en commun).

Ainsi, dans la phrase précédente, "ils" désigne  "un terme" et "un autre".

Bon, déjà c'est compliqué: ici "ils" désigne deux termes ... dont le premier est désigné par l'autre.

On ne sait pas très bien traiter ça automatiquement, même sur le cas simple des pronoms.

(Et dans la phrase précédente, "ça" ça fait référence à quoi ? A l'ensemble des phrases qui précèdent)

Et dans la phrase précédente "ça" ça fait référence à ""ça"".

Et ...

Les coréférences sont de fait la trame, le tissu d'un texte ("texte", qui , entre parenthèses -sic!- vient de la racine de tissu, textile, etc ...)

Et en plus, on peut tomber sur des phrases où presque chaque mot exprime une coréférence:

"Then, they told us she is there with him now"

Ici, il y a 7 coréférences!

"Then (1) , they(2) told us (3) she (4) is there (5)  with him (6)  now (7)"

Chacune de ces coréférences -incluant les 1, 5 et 7- fait bien référence à quelque chose qui a été introduit avant dans le texte.

On est évidemment incapable d'écrire un programme qui permette à un ordinateur de s'y retrouver.

Et pourtant le premier analphabète venu comprend oralement cette phrase en temps réel!

Mais rassurons-nous, grâce aux futurs programmes de recherche européens, ces limites ne seront bientôt plus qu'un mauvais souvenir. 

Voir le thème correspondant dans le programme Horizon 2020, intitulé:

ICT 17-2014: Cracking the language barrier

Cracking ? Ils ont fumé ou quoi ?

Aucun commentaire: