2.3.1.- Les données sur la science en train de se faire

Ces données sont (entre autres) :

- La liste des centres de recherche (dans chaque pays, dans chaque aire linguistique) qui disent faire du traitement automatique du langage naturel ;

- La liste des Universités qui disent enseigner le traitement automatique du langage naturel ;

- La liste (ou le nombre) des chercheurs, des enseignants et des étudiants qui disent chercher, enseigner ou étudier le traitement automatique du langage naturel ;

- La liste des projets de recherche (publics ou privés, nationaux ou internationaux) qui mentionnent explicitement le traitement automatique du langage naturel, avec, pour chacun des projets, la liste des chercheurs et des laboratoires impliqués, le montant du projet, l'origine du financement, les langues étudiées, la description du projet telle qu'elle est faite par ses participants ;

- la liste des termes utilisés dans les publications des centres de recherche, dans les descriptions des enseignements et dans les descriptions des projets de recherche. Ces listes doivent être ordonnées par centres de recherche, ou par pays, ou par aires linguistiques (qui parle de quoi), par co-occurrences de termes (comment on parle) ;

- la liste (ou le nombre) des publications scientifiques indexées avec les termes appartenant à la liste précédente. Cette liste doit être ordonnée par pays, par aires linguistiques de localisation, par langues étudiées ;

- La liste des procédures de financement directes ou indirectes des projets de recherche qui sont utilisées par les laboratoires décrits ci-dessus, ordonnée par pays et par organismes ainsi que par langues étudiées.