Morpho-Syntaxe
Introduction
[modifier | modifier le wikicode]La Morpho-Syntaxe apparaît clairement formée à partir de deux domaines : la morphologie et la syntaxe.
- La morphologie étudie principalement la formation interne des mots dans une langue. Son unité de base, que nous décrirons plus en détail après, est le morphème (ou monème selon les écoles).
- La syntaxe vient du grec suntaxis, signifiant "ordre", "arrangement". Ainsi la syntaxe étudiera l'organisation des unités dans un énoncé.
Ces deux domaines vont nous permettre de tenter d'expliquer comment la structure d'une phrase dans une langue permet à tout locuteur de cette langue de comprendre le sens de cette phrase.
Définition de la morphosyntaxe : La morphosyntaxe est l'ensemble des règles d'utilisation des structures et des contrastes grammaticaux dans le but d'exprimer des relations sémantiques plus ou moins complexes entre objets, personnes et événements. Il semble qu'en ce qui concerne les aspects sémantiques et lexicaux, le développement linguistique se fasse de la même manière chez les enfants souffrant d'un handicap mental que chez les autres; il faut bien sûr tenir compte du fait que le développement de ces aspects du langage est généralement plus lent chez les enfants ayant un handicap mental.
La double articulation
[modifier | modifier le wikicode]Le langage a cette particularité de pouvoir produire un nombre infini d'énoncés.
Cela est possible grâce à ce que l'on appelle la double articulation. Celle-ci est basée sur deux axes : l'axe paradigmatique et l'axe syntagmatique.
Opérer sur l'un de ces actes est opérer sur le sens de l'énoncé obtenu.
L'axe paradigmatique
[modifier | modifier le wikicode]L'unité de base de cet axe est le phonème. Chaque langue dispose d'un nombre fini de phonèmes qui dressent l'inventaire disponible pour prononcer une séquence de la parole.
Ainsi, si dans l'énoncé : "Voici notre mère." nous remplaçons le m par un p, ce qui consiste à opérer sur l'axe paradigmatique, nous obtenons : "Voici notre père", ce qui change le sens de l'énoncé.
L'axe syntagmatique
[modifier | modifier le wikicode]L'unité de base de cet axe est le morphème. Chaque langue dispose d'une grammaire définissant comment on peut organiser les différents morphèmes afin d'obtenir un énoncé compréhensible.
Ainsi, si dans l'énoncé : "C'est un grand homme." nous intervertissons grand et homme, ce qui consiste à opérer sur l'axe syntagmatique, nous obtenons "C'est un homme grand.", ce qui change le sens de l'énoncé.
Comme on le voit donc, l'axe syntagmatique est une notion fondamentale dans la morpho-syntaxe.
Pour résumer grossièrement, l'axe paradigmatique permet de former les mots, et l'axe syntagmatique permet de former les phrases.
Les unités de bases
[modifier | modifier le wikicode]Le morphème
[modifier | modifier le wikicode]La distinction entre ces deux termes n'est pas toujours pertinente et dépend beaucoup des écoles. Pour une certaine simplification, et par meilleure maîtrise de l'auteur du présent livre, nous parlerons désormais uniquement de morphèmes.
Le morphème est, comme on l'a dit plus haut, l'unité de base de la morphologie. On le définit généralement comme "la plus petite unité de sens pertinente du langage".
Ainsi dans "marchons", nous distinguons deux morphèmes : march- et -ons.
- Le premier (march-) peut se définir comme le radical du verbe "marcher", qui porte donc le sens de l'action qui consiste à se déplacer par mouvements alternatifs des jambes.
- Le deuxième (-ons) peut se définir comme la marque de la première personne du pluriel au temps du présent de l'indicatif.
Comme on le voit dans cet exemple, les morphèmes se combinent en suivant des règles : -ons s'est ajouté au radical march- pour permettre la conjugaison du verbe. Leur combinaison est donc significative et peut être étudiée.
Le morphème, comme le signe linguistique, est biface : il est constitué d'une forme signifiante et d'un contenu signifié. C'est pourquoi deux morphèmes peuvent partager un de ses aspects tout en étant distincts.
Les morphèmes "homonymes"
[modifier | modifier le wikicode]Deux morphèmes peuvent présenter une même forme. C'est alors leur contenu signifié qui permettra de les distinguer.
Prenons les morphèmes -ment (dans "calmement") et -ment (dans "déménagement).
- Le premier s'ajoute aux adjectifs pour former des adverbes. On pourra donc dire qu'il signifie "de façon adjectif au féminin".
- Le deuxième s'ajoute aux bases verbales pour former des noms. On pourra donc dire qu'il signifie "le fait de verbe à l'infinitif".
Les allomorphes
[modifier | modifier le wikicode]Deux morphèmes peuvent présenter un même contenu signifié, sans pour autant présenter la même forme.
Prenons les morphèmes réal- et -réel. On les retrouve dans "réaliste" et "irréel". Aussi bien orthographiquement qu'oralement, la forme diffère, cependant l'idée suggérée demeure. Un même signifié peut donc rassembler plusieurs allomorphes.
Le syntagme
[modifier | modifier le wikicode]Le syntagme est l'intégrant du morphème et le constituant de la phrase.
La morphosyntaxe, un outil pour le traitement automatique des langues
[modifier | modifier le wikicode]L'analyse morphosyntaxique ou étiquetage morphosyntaxique (POS tagging en anglais, pour part-of-speech tagging) est utilisé dans le cadre des nouvelles approches de traitement automatique des langues (ou NLP, pour Natural Language Processing). Les approches d'apprentissage automatique (machine learning) pour le traitement automatique des langues ont en effet besoin de propriétés spécifiques pour permettre à un programme d'apprendre le comportement d'une langue donnée. L'étiquetage en morphosyntaxe est très utilisé pour ce faire.
Ce processus consiste à étiqueter à aux mots d'un texte les informations grammaticales correspondant à la partie du discours.
Exemple
[modifier | modifier le wikicode]- Texte original : Nous sommes allées en Bretagne contempler de magnifiques allées couvertes du Néolithique.
- Texte étiqueté : Nous/PRO:PER sommes/VER:pres allées/VER:pper en/PRP/en Bretagne/NAM contempler/VER:infi de/PRP magnifiques/ADJ allées/NOM couvertes/VER:pper du/PRP:det Néolithique/NAM ./SENT
Outils
[modifier | modifier le wikicode]Plusieurs outils sont désormais à disposition permettant l’étiquetage automatique en morphosyntaxe. Ils sont plus nombreux dans les langues anglo-saxonnes mais commencent à voir le jour dans d'autres langues moins répandues. Notamment pour le français, certaines banques de corpus pré-étiquetés à la main (French Treebank ou Sequoia) permettent aujourd'hui d'entraîner n'importe quel modèle d’étiquetage sur la langue française. Certains outils d’étiquetage morphosyntaxique pré-entraînés commencent donc à voir le jour pour cette langue, comme le TreeTagger ou le Stanford Tagger, qui peuvent être utilisés directement sans devoir entraîner les modèles préalablement.