Kevin Bretonnel Cohen est un chercheur mondialement connu pour ses travaux sur l’analyse de la littérature scientifique, visant à représenter les informations et les connaissances qui y sont publiées, ainsi que pour l’évaluation de systèmes de traitement automatique des langues cherchant à réaliser cette tâche. Il allie une expérience professionnelle dans le domaine médical et dans la conduite de projets logiciels à une formation universitaire en linguistique, ce qui lui donne une compétence unique pour s’attaquer au traitement automatique de la langue biomédicale. Il a notamment été précurseur dans l’étude de la variabilité des noms de gènes dans les résumés de la base MEDLINE et dans l’introduction de représentations linguistiques plus profondes comme les relations prédicat-arguments dans l’analyse des textes biomédicaux. Il a conçu et coordonné de nombreuses tâches dans des évaluations internationales comme Bio- Creative dès les débuts de cette série d’évaluations qui a marqué le domaine, et a publié des corpus annotés tels que CRAFT et BioMedSumm, qui apportent des ressources précieuses aux chercheurs du domaine. Ce dernier corpus, associé dans la campagne d’évaluation internationale TAC 2014 à une tâche originale de résumé automatique d’un article orienté par la façon dont il est cité par d’autres articles, préfigure l’évolution des futurs systèmes d’accès à la littérature scientifique. Kevin Cohen est fondateur en 2008 et depuis président du SIG Biomed de l’Association for Computational Linguistics, qui a permis de mettre en relation au plus haut niveau la communauté du traitement automatique des langues avec les problématiques du domaine biomédical. Inversement, il a largement contribué à faire connaître l’intérêt des méthodes de traitement automatique des langues auprès des biologistes et bioinformaticiens, par des conférences invitées et des articles dans les grandes revues du domaine.

Apport de la visite du professeur Bretonnel Cohen :
  • une compétence forte dans le traitement de la littérature scientifique
  • une activité de traitement automatique des langues avec des applications notamment à l’analyse des textes médicaux hospitaliers
  • un valorisation du Thème 2 de l’axe DataSense : (Making sense of complex, heterogeneous data and knowledge) avec les GT :