Les séances précédentes ont été consacrées à l'analyse lexicale et morphologique. Il est temps de se détacher de la dimension lexicale des textes pour tendre vers la dimension syntaxique.
Keyword - POS tagging
21nov.
Travaux Pratique TALN - Contexte syntaxique
23:42 - Par Fabien Poulard - Sciences & Recherche
14nov.
Travaux Pratique TALN - Morphologie et contexte syntaxique
18:55 - Par Fabien Poulard - Sciences & Recherche
Dans le TP précédent nous nous sommes limité à l'analyse des mots en-dehors de tout contexte. Il s'est alors agi de découper un texte en mots puis de compter ces derniers.
Dans ce second TP, nous allons nous intéresser à la morphologie des mots (leur forme textuelle). Nous explorerons notamment deux procédés de normalisation morphologique : la racinisation et la lemmatisation. Nous découvrirons ensuite que le contexte des mots, combiné à leur morphologie, peut nous apprendre bien des choses.
09janv.
Cours de TALN (2) : morphologie et étiquetage des rôles grammaticaux
22:59 - Par Fabien Poulard - Sciences & Recherche
09janv.
Python et Tree Tagger
19:30 - Par Fabien Poulard - Sciences & Recherche - 4 commentaires
Tree Tagger est un outil d'étiquetage des rôles grammaticaux disponible pour plusieurs plateformes et pour plusieurs langues. Si sa licence n'est pas libre, il peut être utilisé dans un cadre de recherche ou bien pour l'éducation.
Il existe un projet de wrapper Python pour cet outil qui pourrait m'être utile pour mon cours de TALN.
10mar.
L'étiquetage des rôles grammaticaux
17:26 - Par Fabien Poulard - Sciences & Recherche - un commentaire
Une phase d'analyse presque aussi utilisée que la phase de découpage en mots est l'étiquetage des rôles grammaticaux (POS, pour Part Of Speech).