Version: 2.2
Auteurs : Véronique Gendner, Anne Vilnat
Révisions : Laura Monceaux, Patrick Paroubek, Isabelle Robba, Gil Francopoulo, Marie-Laure Guénot
Date: 18 novembre 2009
Note: les propositions de modification par rapport à la version
1, sont signalées avec la petite marque:
Les éléments à annoter dans le texte donné
sont les suivants :
le découpage en groupes syntaxiques
les relations syntaxiques :
entre mots
entre un groupe syntaxique et un mot
entre groupes syntaxiques
Il ne s'agit pas d'appliquer fidèlement telle ou telle théorie syntaxique,
mais de définir un découpage en groupes, sans doute un peu grossier mais suffisamment
consensuel, et traductible dans différents cadres théoriques pour permettre
la comparaison et l'évaluation de différentes sorties d'analyseurs syntaxiques.
On fait l'hypothèse qu'on n'a pas de constituants discontinus ni de syntagmes
croisés, ni de constituants récursifs. Ceci sera détaillé dans le D.1.I
Pas de constituants discontinus ou croisés.
Donc ce que nous appelons "groupe" dans le présent
document n'est pas un groupe de la grammaire générative, le terme
correspond plus à ce que les anglo-saxons désignent sous le nom
de "chunk".
De ce fait les groupes formés sont petits de façon à ne pas avoir de récursivité,
tout en gardant la précision de l'annotation. Les relations servent alors à
traduire les dépendances entre ces groupes minimaux.
Notons que la segmentation en mots et la segmentation en énoncés
(ces derniers correspondant, pour la plupart, à la notion commune
de phrase) sont prédéfinies et supposées correctes.
Les dépendances entre constituants sont annotées à l'intérieur
d'un même énoncé. Pour des détails supplémentaires
sur ce point voir D.1.XII Dépendances entre
énoncés
Toutes les formes proposées ne feront pas forcément partie d'un constituant
annoté (c'est le cas des ponctuations par exemple).
Notation : Dans toute la suite du document, nous donnerons les
exemples d'annotation en constituants, soit sous la forme qui est obtenue
en résultat après annotation manuelle (comme dans la section
A2 ci-dessous), soit en adoptant une notation
à la XML, en encadrant le constituant par les balises l'étiquetant
(exemple : <GN> leurs résultats </GN>).
A.2 Exemple d'annotation en constituants et relations :
L'annotation manuelle s'effectue en deux étapes :
annotation en constituants ,
relevé des relations
Voici ces deux étapes illustrées sur l'exemple suivant :
En quelle année Desmond Mpilo Tutu a -t-il reçu le prix
Nobel de la paix ?
Annotation manuelle en constituants
Enonce 1
GP 1
GN 2
NV 3
NV 4
GN 5
GN 6
GP 7
En
quelle
année
Desmond
Mpilo
Tutu
a
-t-il
reçu
le
prix
Nobel
de
la
paix
?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
Relevé des relations:
Sujet - verbe.
SUJ_V(GN2,F7)
SUJ_V(F8,F7)
Auxiliaire - verbe
AUX_V(F7,F9) )
Objet direct - verbe
COD_V(GN5,NV4)
Complément - verbe
CPL_V(GP1,NV4)
Modifieur - verbe
MOD_V
Complémenteur
COMP
Attributs - sujet/objet
ATTB_SO
Modifieur - nom
MOD_N(GP7,F11)
MOD_N(GN6,GN5)
Lorsqu'il existe des relations de modifieur de nom qui sont internes
au groupe nominal (par exemple les adjectifs antéposés), et
qui sont potentiellement ambiguës (par exemple en cas de noms propres
composés), on choisit de noter les liens "en cascade". Voir un exemple.
Modifieur - adjectif
MOD_A
Modifieur - adverbe
MOD_R
Modifieur - préposition
MOD_P
Coordination
COORD
Apposition
APP
Juxtaposition
JUXT
On trouvera en annexe un exemple plus complet d'annotation.
A.3 Format des données initiales
Les données à annoter sont codées en html, sous forme
de tableaux. Les énoncés sont numérotés et segmentés
en formes.
A chaque forme correspond une cellule d'un tableau.
La plupart des énoncés sont de type phrase :
Enonce 2
En
quelle
année
a
-t-on
construit
la
première
automobile
?
Certains contiennent simplement un ou plusieurs syntagmes nominaux :
Enonce 3
Quelle
jolie
fille
!
Enonce 4
Le
journal
,
Simon
Tivolle
.
D'autres peuvent inclure plusieurs phrases, quand il s'agit de paroles
rapportées : voir D.1.VII
A.4 Format de données annotées
Description des différents formats de données pour l'annotation manuelle.
A.4.I Les étapes d'annotation pour les constituants NV,
PV, GN, GP,
GA, GR
L'annotateur modifie la couleur des formes en fonction du type
du groupe auquel elles appartiennent. Voir un exemple d'annotation
des groupes syntaxiques (avant/après). Certaines formes ne font partie d'aucun
groupe, et ne sont donc pas annotées à ce stade.
<
A noter:
Cohérence pour l'inclusion des ponctuations dans les groupes :
Selon le cas, les ponctuations doivent être
incluses dans un groupe ou exclues du groupe.
De manière générale, la ponctuation ne figure pas dans
le groupe, ainsi, nous aurons :
<GN> Le chat </GN><NV>
miaule </NV> , <GN> le chien </GN><NV>
aboie </NV> .
L'antéposition avec ponctuation impose l'inclusion dans le groupe, comme dans
:
<GN> Le grand, méchant Albert </GN>
ne se présente pas.
Dans le cas de parenthèses, veiller à ce que la première soit dans le GN,
comme dans : déclarer nuls <GN> ( leurs ) résultats </GN>
(leMonde.08.01)
Les virgules marquant une incise, une apposition, une coordination etc.
ne sont pas à insérer dans un groupe. <NV> imaginez </NV> , <NV>
dis -je </NV> , que <GN> le panneau
</GN>...
La liste des ponctuations est constituée des signes de ponctuation
habituels auxquel on ajoute "etc".
Conjonctions, interjections et autres bizarreries :
Ne devront pas être inclus dans un groupe, les ponctuations qui constituent
une limite de groupe, les conjonctions, les interjections et les autres éléments
inclassables, par exemple les caractères "soulignés" marquant un espace à
remplir dans un formulaire quand ils sont en début ou fin de groupe .
Exemples : <GN> les petits et grands véhicules </GN>, mais <GN> les petits camions </GN> et <GN> les grandes fourgonnettes </GN>
La distinction entre conjonction et autre fonction
peut se retrouver à partir de la relation complémenteur.
A.4.II Les étapes d'annotation pour les relations.
Les tables décrivant les relations contiennent les adresses référençant les
arguments (voir exemple en A2). Les adresses sont formées
de l'agglutination du type de constituant (e.g. GN) et de l'indice (numérique)
du constituant dans l'énoncé (e.g. GN2). Lorsque l'argument est une forme simple,
son type est noté F. Les adresses peuvent référencer indifféremment des
constituants ou des formes.
Le noyau verbal regroupe un verbe, les pronoms clitiques
(plus éventuellement les particules euphoniques:-t-
et l', ainsi que la particule ne) qui lui sont rattachés. La notion de pronom clitique est ici assez étendue (voir la liste)
(Pour les adverbes de négation, voir adverbes de
négation discontinus )
Un noyau verbal peut être à différents modes
: temps conjugués mais aussi participe présent, participe
passé et infinitif. Nous identifions un NV distinct pour chaque forme verbale:
Énoncé
2
GP 1
NV 2
NV 3
GN 4
En
quelle
année
a
-t-on
construit
la
première
automobile
?
1
2
3
4
5
6
7
8
9
10
En présence d'un temps composé (séquence auxiliaire(s)
et verbe), chacun constitue un NV différent (pour les relier,
voir C.2 La relation Auxiliaire-verbe )
sinon on ne pourrait pas marquer les formes qui peuvent s'insérer
entre ces NV, comme les adverbes par exemple. Dans la suite on utilisera la dénomination de verbe principal pour désigner le verbe, par opposition à l'auxiliaire quand les deux sont présents dans une proposition (voir B.1.III)-.
Énoncé
2
GP 1
NV 2
GR 3
NV 4
GN 5
En
quelle
année
a
-t-on
vraiment
construit
la
première
automobile
?
1
2
3
4
5
6
7
8
9
10
11
Dans le cas d'une séquence auxiliaire-participe passé, les
clitiques et la particule ne sont tous associés à l'auxiliaire
:
Énoncé
13
GN 1
NV 2
GR 3
NV 4
Les
trois
jeunes
filles
ne
l'
ont
pas
admis
.
1
2
3
4
5
6
7
8
9
10
ou encore dans : La porte de la chambre <NV>fermée</NV> à clef à l'intérieur , les volets de l'unique fenêtre <NV>fermés</NV> , eux aussi , à l'intérieur , et , par-dessus les volets , les barreaux intacts , des barreaux à travers lesquels <NV> vous n' auriez</NV> pas <NV> passé </NV> le bras ...
et mademoiselle qui <NV> appelait </NV> au secours ! ... ou plutôt non , <NV>
on ne l' entendait </NV> plus ... <NV> elle était </NV> peut-être morte ... mais <NV> j' entendais </NV> encore , au fond du pavillon , monsieur qui <NV> essayait </NV> d' ébranler la porte ... <NV> nous avons </NV><NV> repris </NV> notre course, la concierge et moi , et <NV> nous sommes </NV><NV>revenus </NV>
au pavillon .
A noter:
B.1.I Adverbes de négation discontinus:
La particule de négation ne est incluse dans le NV auquel elle
se rattache (voir Énoncé 14, 15, 16, 17 et 18). Les autres adverbes de négation forment un GR car ils peuvent se trouver
à distance du verbe auquel ils se rattachent.
Dans la forme ne...que, que est adverbe et forme un GR (voir
Énoncé 18), ne reste rattaché au verbe (dans le NV correspondant).
Avec un infinitif, les adverbes de négation sont placés avant le verbe;
dans ce cas ils sont inclus dans le NV ou le PV (voir énoncé 15) ou : ma fille avait juré <PV> de ne jamais me quitter
</PV>
Énoncé 14
GN 1
NV
2
GR 3
NV 4
Jean
ne
veut
pas
venir
.
1
2
3
4
5
6
Énoncé 15
GN 1
NV 2
NV
3
Jean
préfère
ne
pas
venir
.
1
2
3
4
5
6
Énoncé 16
GN 1
NV
2
NV 3
GR 4
Jean
ne
sait
manger
proprement
.
1
2
3
4
5
6
Énoncé 17
GN 1
NV
2
GR 4
Jean
ne
dort
guère
.
1
2
3
4
5
Énoncé 18
GN 1
NV
2
GP
3
GR 4
GN
5
Jean
ne
mange
avec
plaisir
que
les
gâteaux
.
1
2
3
4
5
6
7
8
9
B.1.II Participes - Adjectifs
On notera les participes passés et les participes présents comme des noyaux
verbaux :
pour les participes passés, quand ils suivent l'auxiliaire pour former
des temps composés, comme dans les énoncés 2 et 13 ci-dessus, par exemple;
quand ils sont dans une proposition participiale :
leurs enfants <NV> élevés</NV>,
les parents entreprennent un grand voyage
ces prescriptions<NV améliorant</NV>
son état, le médecin poursuivit le traitement
quand ils sont modifiés par un complément, comme dans
La porte de la chambre <NV>fermée</NV>
à clef à l'intérieur
Les côteaux <NV>environnant</NV>
la ville sont très verts.
Dans les autres cas, ils sont notés comme des adjectifs (voir B.4
groupe adjectival).
Pour que l'annotation sous la forme d'un participe soit possible, il faut
évidemment que le verbe existe. Ainsi, dans "Robert est plus âgé
de 3 ans", "âgé" est un adjectif car le verbe
"âger" n'existe pas.
Lorsqu'il y a ambiguïté entre
l'interprétation verbe/adjectif, comme dans "Michaël est mort", où mort
peut être un adjectif attribut ou une forme passive du verbe mourir, on
privilégiera l'interprétation verbale dans les cas où il s'agit d'une
véritable forme passive issue d'un verbe transitif, et sinon
l'interprétation adjectivale.
D'où les annotations :
les carottes <NV> sont</NV> <NV> cuites</NV>
Michaël <NV> est</NV> <GA> mort</GA>
Dans le premier exemple le verbe principal est <NV>cuire</NV>, et dans le second <NV>être</NV>. Voir ci-dessous.
B.1.III Verbe principal
La notion de verbe principal utilisée dans la suite s'entend par
rapport à une proposition. Il s'agit du verbe unique de la proposition
ou du verbe au participe passé dans les cas de temps composés ou de
forme passive (le verbe à montée ou à contrôle). Nous ne cherchons pas
à identifier des verbes modaux qui seraient des auxiliaires : on
considère l'infinitif qui le suit comme une autre proposition, autour
du second verbe.
D'où les annotations :
Les gendarmes <NV> veulent</NV><NV> manger</NV> des carottes
Les gendarmes <NV> auraient</NV><NV> voulu</NV><NV> manger</NV> des carottes
Dans les deux cas, il y a deux verbes principaux <NV> vouloir</NV> et <NV> manger</NV>. Dans le deuxième exemple, on a en plus un auxiliaire du premier verbe principal. D'autres exemples sont donnés en (C.1. La relation Sujet-Verbe).
B.2 Le groupe nominal: <GN> </GN>
Les groupes nominaux sont constitués d'un nom éventuellement
précédé d'un déterminant (voir D.3.II Liste des
déterminants) et/ou d'un adjectif antéposé accompagné de ses modifieurs
(qui peuvent comprendre des adverbes), d'un nom propre, d'un pronom
NON clitique ou d'un nombre isolé.
Quand un adjectif est précédé d'un déterminant, il reste adjectif mais forme
un GN (voir D.1.III Phénomènes de transcatégorisation).
Un nombre quand il est quantifieur est assimilé
à un déterminant.
Les jours de la semaine ainsi que les moments de la journée sont des GN (lundi, matin, soir,... : voir aussi D.1.XV Expressions temporellles).
Groupes nominaux complexes:
Quand plusieurs noms propres se succèdent sans déterminant ni préposition, et qu'ils ont le même référent, ils
forment un seul GN (voir aussi à ce sujet C.8 La
relation Modifieur-Nom : MOD_N et C.13 La relation
d'Apposition).
Un prénom composé est un GN (exemple: Jean-Thomas).
Quand le groupe est une date, il ne forme qu'un seul GN.
L'année peut avoir un modifieur antéposé comme "fin
1991".
Quand la séquence de mots comporte un nombre (ou
une référence comportant des chiffres) postposé au nom
comme "ISSN 36", "ISSN 36B", "formulaire A4", "numéro
4", "article 49.3", "les années 70", "Paris
X", il ne forme qu'un seul GN. Il en est de même pour les formes telles que "ses initiales JFK"
En
revanche quand ces éléments sont coordonnés, comme dans "Les parties
II.1 et III.4", on annotera indépendamment le GN "Les parties II.1", en
suivant la logique précédente, et la numérotation coordonnée "III.4",
qui sera arbitrairement considérée comme un GA.
Quand le groupe est une abréviation comme "R & D", il
ne forme qu'un seul GN.
Exemples:
<GN> Quel </GN>
était <GN> le nom </GN>
de la série télévisée , dans laquelle jouait
<GN> Karl Malden </GN> ,
et <GN> qui </GN> avait
<GN> San Francisco </GN>
dans son titre ?
En quelle année a -t-on construit <GN> la première automobile </GN>
?
<GN> La fort belle jeune fille </GN> ment effrontément.
<GN> la porte </GN> de la chambre fermée à clef à l' intérieur ,
<GN> les volets </GN> de l' unique fenêtre fermés , <GN> eux </GN> aussi , à l' intérieur , et , par-dessus les volets , <GN> les barreaux </GN> intacts , <GN> des barreaux </GN> à travers lesquels vous n' auriez pas passé <GN> le bras </GN> ... et <GN> mademoiselle </GN><GN> qui </GN>
appelait au secours ! ... ou plutôt non , on ne l' entendait plus ...
elle était peut-être morte ... mais j' entendais encore , au fond du
pavillon , <GN> monsieur </GN><GN> qui </GN> essayait d'ébranler <GN> la porte </GN> ... nous avons repris <GN> notre course </GN> , <GN> la concierge </GN> et <GN> moi </GN> , et nous sommes revenus au pavillon .
<GN> La plus belle </GN>
de la collection est <GN> la verte </GN>.
<GN> Le président</GN> <GN> Xavier Chapuisat </GN> est présent.
<GN> Le système</GN> <GA> européen </GA> <GN> Galileo </GN> sera exploité vers 2013.
<GN> Le député</GN> <GN> PS </GN> est présent.
<GN> Le président </GN> <GP> de l'Université Paris-Sud </GP
> <GN> Xavier Chapuisat </GN> est présent.
<GN> Une centaine</GN> <GP> de personnes </GP> sont présentes.
<GN> Beaucoup de gens</GN> sont venus.
<GN> Des centaines </GN> peut-être même <GN> des milliers </GN> <GP> d'opposants </GP > se sont rassemblés.
<GN> Desmond Mpilo Tutu </GN>
<GN> lundi 3 janvier 2007 </GN>
<GN> Robert</GN> arrive ><GN> lundi</GN>
<GN> 4</GN> .
Il mange <GN> 4 pommes</GN> .
Il mange <GN> les 4 pommes</GN> .
Elle observe <GN> les trois italiens</GN> .
Il se rappelle <GN> les années 70</GN> .
Il se rappelle <GN> l'année 1999</GN> .
Il utilise <GN>ses initiales JFK</GN> comme signature
<GN>Les parties II.1 </GN> et <GA>III.4 </GA>
B.3 Le groupe prépositionnel: <GP>
</GP>
Les groupes prépositionnels sont constitués d'une
préposition et du GN qu'elle introduit ou d'un déterminant
et d'une préposition contractés (du, aux, des) avec
le GN introduit.
On forme aussi un GP en cas de préposition
suivie d'un adverbe.
On considère également comme des GP
les pronoms qui remplacent des GP, comme dont, où,...
Exemples:
la porte <GP> de la chambre </GP>
fermée <GP> à clef </GP><GP> à l' intérieur </GP>
, les volets <GP> de l' unique fenêtre
</GP> fermés , eux aussi , <GP> à l' intérieur </GP>
, et , <GP> par-dessus les volets </GP>
, les barreaux intacts , des barreaux <GP>
à travers lesquels </GP> vous n' auriez pas passé
le bras ... et mademoiselle qui appelait <GP>
au secours ! </GP> ... ou plutôt non , on ne l' entendait
plus ... elle était peut-être morte ... mais j' entendais encore
, <GP> au fond </GP><GP> du pavillon </GP> , monsieur
qui essayait d' ébranler la porte ... nous avons repris notre course
, la concierge et moi , et nous sommes revenus <GP>
au pavillon </GP> .
Il reste une personne <GP> de
trop </GP> .
La femme <GP> dont</GP>
vous parlez
A noter :
Cette annotation en constituant GP est
un raccourci qui permet de noter à la fois l'étiquette
du constituant et la relation entre le premier élément (la
préposition) et ce qui suit (le GN introduit).
Elle est possible dans la plupart des cas de GP,
car la préposition n'est que rarement détachée du GN qu'elle introduit. Cependant, on peut rencontrer
des cas d'incises ou de préposition postposée par exemple où il y a séparation entre ces
éléments. Il faut alors revenir à l'annotation "complète",
à savoir : annoter le GN comme tel, laisser
la préposition non annotée et traduire la relation de dépendance
entre la préposition et le GN par une
relation de type complémenteur (C.6 La relation
complémenteur).
On trouve un cas un peu similaire lors de coordinations où la préposition
est "factorisée" pour deux GN (Notes dans C.12 Les cas de coordination).
Exemples :
Il arrive <GP>en retard </GP>, avec , <GP>dans sa poche </GP> , <GN>un petit discours</GN> écrit qu' il est obligé de garder .
La relation entre avec et un petit discours sera annotée à l'aide d'une relation de dépendance COMP
<GN>Vingt ans</GN> durant , il subit ses jérémiades. Là aussi la relation entre vingt ans et durant sera annotée par un COMP.
<GN>les jeunes filles </GN> arboraient donc <GN>un fichu</GN> étroitement noué <GP>sous le menton</GP> <GP> dans les couloirs</GP> et <GN>la cour</GN> <GP> de récréation</GP>
La relation entre dans et la cour sera annotée en dépendance COMP aussi.
Dans le cas de prépositions adjacentes, on les englobe dans un seul GP.
<NV>Je viens</NV> <GP>de chez le coiffeur</GP>
<GN>Le chat </GN> <NV>sort</NV> <GP>de derrière la haie</GP>
<GN>La réunion </GN> <NV>est</NV> <GP>pour dans dix jours</GP>
Quand le GP est réduit à une préposition, dont le GN est élidé, on annote la préposition comme un GP. <NV>Je suis</NV> <GP>pour</GP>
B.4 Le groupe adjectival: <GA> </GA>
Les groupes adjectivaux contiennent un adjectif (lorsqu'il
n'est pas épithète antéposé au nom) ou
un participe passé employé comme adjectif.
Exemples :
La porte de la chambre fermée à clef à
l' intérieur , les volets de l' unique fenêtre fermés,
eux aussi , à l' intérieur , et , par-dessus les volets ,
les barreaux <GA> intacts </GA>
, des barreaux à travers lesquels vous n' auriez pas passé
le bras ... et mademoiselle qui appelait au secours ! ... ou plutôt
non , on ne l' entendait plus ... elle était peut-être <GA> morte </GA> ... mais j' entendais
encore , au fond du pavillon , monsieur qui essayait d' ébranler
la porte ... nous avons repris notre course , la concierge et moi , et nous
sommes revenus au pavillon .
Les enfants <GA> désobéissants
</GA> seront punis.
La solution <GA> retenue </GA>
fut celle proposée par Jean.
Remarques :
On ne crée pas de groupe pour les adjectifs antéposés
au nom, ceux-ci sont inclus dans le GN (même quand le GN ne contient
pas de forme nominale, voir ci-dessus) et la relation au nom est indiquée
entre les formes nominale et adjectivale, que l'adjectif soit ou non antéposé
(voir C.8 La relation modifieur du nom)
:
Énoncé
13
GN 1
GA 2
NV 3
GN 4
Le
petit
chat
roux
boit
du
lait
?
1
2
3
4
5
6
7
8
Pour l'annotation des comparatifs et des superlatifs, se reporter à la section D.1.XIV
On considèrera arbitrairement comme des GA
les numérotations postposées au nom qui sont employées dans des formes
complexes comme des coordinations (comme par exemple " <GN> >Les parties II.3 </GN> et <GA>III.4
</GA> "
)
B.5 Le groupe adverbial <GR> </GR>
Les groupes adverbiaux contiennent un adverbe (à l'exception de l'adverbe de négation ne qui est inclus dans le noyau verbal).
Les adverbes forment des groupes adverbiaux, même lorsqu'ils sont unaires.
Exemples:
La porte de la chambre fermée à clef à l'
intérieur , les volets de l' unique fenêtre fermés ,
eux <GR> aussi </GR> , à
l' intérieur , et , par-dessus les volets , les barreaux intacts
, des barreaux à travers lesquels vous n' auriez <GR>pas </GR> passé le
bras ... et mademoiselle qui appelait au secours ! ... ou <GR> plutôt </GR> <GR>non </GR>
, on ne l' entendait <GR> plus</GR>
... elle était <GR> peut-être
</GR> morte ... mais j' entendais <GR> encore </GR> , au fond du pavillon
, monsieur qui essayait d' ébranler la porte ... nous avons repris
notre course , la concierge et moi , et nous sommes revenus au pavillon
.
Ce travail <GR> pas </GR>
fini sera à reprendre.
Il ne s'en rend <GR> pas </GR><GR> moins</GR>compte.
Il ne s'en poursuit <GR> pas </GR><GR> moins</GR>.
Certaines formes composées complètement figées sont annotées en
tant que GR parce qu'ils en ont la forme syntaxique, et que les formes
prises individuellement ne permettent pas d'analyser la phrase (voir D.3.IV Liste des adverbes composés).
B.6 Le groupe verbal introduit par une préposition <PV> </PV>
Les balises <PV> </PV> délimitent
un noyau verbal dont le verbe n'est pas conjugué (infinitif,
participe présent, ...) et introduit par une préposition.
Elles peuvent contenir aussi des modifieurs de ce verbe antéposés au verbe, comme des adverbes.
Exemples :
... mais j' entendais encore, au fond du pavillon, monsieur
qui essayait <PV> d' ébranler </PV>
la porte... nous avons repris notre course , la concierge et moi , et nous
sommes revenus au pavillon .
il s'efforçait <PV> de
ne vraiment pas ébranler <PV> la porte...
Il dérapa <PV> en reprenant </PV> ses affaires.
A noter :
On ne fera pas de distinction entre de préposition et
de complémenteur: tous les noyaux verbaux introduits par
de ou d' sont notés <PV>
</PV>.
De même que pour la notation GP,
la notation PV est un raccourci qui
permet de noter à la fois l'étiquette du constituant et la
relation entre le premier élément (la préposition)
et ce qui suit (le NV introduit). Elle est possible
dans la plupart des cas de PV, car la préposition
n'est que rarement détachée du NV
qu'elle introduit. Cependant, on peut rencontrer des cas d'incises par exemple
où il y a séparation entre ces éléments. Il
faut alors revenir à l'annotation "complète", à savoir
: annoter le NV comme tel, laisser la préposition
non annotée et traduire la relation de dépendance entre la
préposition et le NV par une relation
de type complémenteur (C.6 La relation complémenteur).
On trouve un cas un peu similaire lors de coordinations où la préposition
est "factorisée" pour deux NV (Notes dans C.12 Les cas de coordination).
Exemple :
il est interdit <PV>de boire </PV>
et <NV>manger</NV> dans les salles
machine
la relation entre de et manger sera annotée en dépendance
COMP.
C. Les relations
A la fin de l'annotation en constituants, on a créé un fichier
dont on peut consulter un exemple (celui qui a servi
tout au long de la partie B, extrait du Mystère de la Chambre Jaune)
en annexe. Il s'agit d'un fichier html, où les constituants sont
repérés par un code de couleur.
Ce fichier est alors traité automatiquement, de façon à
le reconstruire (voir l'exemple,sur le même extrait,
en annexe) sous une forme où les différents constituants sont
numérotés, de façon à rendre possible l'annotation
des relations entre ces constituants.
C'est le but de l'étape suivante, décrite ci-dessous, durant
laquelle l'ensemble des relations est annoté en remplissant les tableaux
adéquats.
La liste des relations à relever est la suivante :
Afin de n'oublier aucune relation dans les énoncés, il est
conseillé à l'annotateur de procéder de la façon
suivante, pour chaque énoncé :
identifier les verbes. Pour chaque forme verbale hors auxiliaire, chercher :
le(s) sujet(s) potentiel(s) (y compris pour les auxiliaires pour cette relation),
l'(les) auxiliaire(s) potentiel(s),
le(s) complément(s) d'objet direct potentiel(s),
le(s) complément(s) potentiel(s),
le(s) modifieur(s) potentiel(s),
le(s) attributs sujet/objet potentiel(s),
identifier les subordonnants :
annoter les relations de complémenteurs
vérifier ce qu'il complète
identifier les noms. Pour chaque nom :
chercher le(s) modifieurs
identifier les adjectifs. Pour chaque adjectif :
chercher le(s) modifieurs
vérifier ce qu'il modifie, et l'ajouter s'il a été
oublié
identifier les adverbes. Pour chaque adverbe :
chercher le(s) modifieurs
vérifier ce qu'il modifie,et l'ajouter s'il a été
oublié
identifier les coordonnants :
chercher les coordonnés,
annoter les coordinations
annoter les appositions
annoter les juxtapositions
La liste précédente peut être utilisée pour
vérifier qu'aucune relation n'a été oubliée; mais
TOUTES les relations mentionnées ne sont PAS FORCEMENT représentées
dans tous les énoncés.
C.1 La relation Sujet-Verbe : SUJ_V
La relation sujet - verbe se note entre le (ou les
) forme(s) ou groupe(s) sujet et le verbe correspondant.
Dans le cas de temps composés, le sujet est rattaché à
l'auxiliaire. C'est la seule relation qui n'est pas rattachée au verbe principal.
Dans le cas des pronoms clitiques, la relation se note non pas entre le
groupe et la forme verbale, mais entre le numéro de la forme du
clitique et la forme verbale
La relation sujet - verbe se note également entre le participe
passé ou présent d'une participiale et son sujet, dans les
autres cas, la relation sera notée commme un modifieur de nom (C.8.).
Dans le cas d'infinitive ou de gérondif, on
essaiera autant que possible de noter le sujet. C'est le cas des verbes
à contrôle comme dans les énoncés 14, 92 et 93. On le fera aussi pour
les adjoints comme l'énoncé 105. En revanche pour les infinitifs qui
apparaissent dans des locutions, on ne cherchera pas à rétablir le
sujet (voir D.3.III Prépositions composées et D.3.IV Adverbes composés).
On ne rétablit le sujet que s'il est présent dans la phrase.
Pour les formes passives, on notera avec cette relation le sujet
apparent, sans essayer de rétablir le sujet profond (voir l'énoncé 85).
SUJ_V(GN1,NV2), SUJ_V(F4,F6),
On note en italique les relations qui seront explicitées ensuite : CPL_V(GP3,NV2), CPL_V(PV4,NV2)
Le verbe principal est propose.
Énoncé 95
GN 1
NV 2
NV 3
NV 4
GN 5
Marie
lui
a
fait
faire
la
vaisselle
.
1
2
3
4
5
6
7
8
SUJ_V(GN1,NV2), SUJ_V(F2,NV4), AUX_V(F2,NV3), CPL_V(F2,NV3), COD_V(NV4,NV3), COD_V(GN5,NV4)
Le verbe principal est fait dans la première proposition.
La relation auxiliaire - verbe se note entre l'auxiliaire et le
verbe correspondant.
Les seuls auxiliaires sont les verbes être et avoir, les verbes modaux
(par ex. pouvoir) seront considérés dans tous les cas comme
des verbes principaux. (e.g. puisse à ce point manquer de ).
On annotera le passif comme un temps composé, en annotant une relation
AUX_V entre l'auxiliaire être et le participe du verbe au passif
(voir ci-dessous, énoncé 25).
Exemples:
Énoncé
2
GP 1
NV 2
NV 3
GN 4
En
quelle
année
a
-t-on
construit
la
première
automobile
?
1
2
3
4
5
6
7
8
9
10
AUX_V( F4 , F6 )
Énoncé
25
GN 1
NV 2
NV 3
NV 4
GP 4
La
première
automobile
a
été
construite
en
1895
.
1
2
3
4
5
6
7
8
9
AUX_V(F4,F5), AUX_V(F5,F6)
C.3 La relation Objet Direct-Verbe : COD_V
La relation objet direct - verbe se note entre les groupes objet
direct et le verbe correspondant.
Dans le cas de temps composés, les relations objet direct- verbe,
complément - verbe et modifieur-verbe se notent avec
le verbe principal (voir B1.III), en indiquant indifféremment la forme de
celui-ci ou le syntagme qui la contient.
Remarque : les trois relations qui sont autour du verbe (objet direct- verbe, complément - verbe et modifieur-verbe) étant voisines nous
noterons dans les exemples qui suivent les occurrences de ces trois relations,
pour illustrer ce qui les distingue.
Exemples (voir aussi exemples
de CPL_V et de MOD_V) :
Énoncé 2
GP 1
NV 2
NV 3
GN 4
En
quelle
année
a
-t-on
construit
la
première
automobile
?
1
2
3
4
5
6
7
8
9
10
COD_V(GN4,F6), CPL_V(GP1,F6)
Énoncé
14
GN 1
NV 2
GR 3
NV 4
Jean
ne
veut
pas
venir
.
1
2
3
4
5
6
COD_V(NV4,F3), MOD_V(GR3,F3)
Pour reconnaître si un infinitif est ou non objet direct du verbe
(qu'il s'agisse d'un NV ou d'un PV), on peut tester d'abord si la pronominalisation
ou la passivation est possible, dans ce cas il s'agit d'un COD (comme dans
l'énoncé 14 ci-dessus, on peut dire Jean ne le veut pas,
ou l'énoncé 32 ci-dessous : Elle le lui demande), sinon
il s'agit d'un complément, comme dans l'énoncé 20 ci-dessous.
Énoncé
20
NV 2
NV 3
Je
le
laisse
entrer
.
1
2
3
4
5
COD_V(F2,F3), CPL_V(NV3,F3)
Dans le cas des complétives objet, noter le NV de la subordonnée
comme objet direct du verbe principal. Attention, lorsque la complétive
a une forme verbale composée c'est le verbe principal et non l'auxiliaire
qui porte la relation COD_V, par exemple :
Énoncé
21
GN 1
NV 2
NV 3
NV 4
GR 5
GN 6
le
vétérinaire
croyait
qu'
il
avait
mangé
trop
d'
herbe
.
1
2
3
4
5
6
7
8
9
10
11
COD_V(NV4,NV2)
Penser à vérifier s'il existe des compléments pour
les verbes des PV :
Cette relation concerne les autres compléments du verbe exprimés
sous forme de GP ou de PV, que ce soit les circonstants ou les compléments
indirects (introduits par une préposition). Ces compléments
de verbe sont rattachés au verbe qu'ils modifient (que ce soit sa
forme ou le syntagme qui la contient).
Dans le cas de temps composés, les relations objet direct-verbe,
complément-verbe et modifieur-verbe se notent avec
la forme du verbe principal (voir B1.III) Exemples (voir aussi exemples
de COD_V et de MOD_V) :
Énoncé
5
NV 1
GR 2
GA 3
NV 4
GR 5
GP 6
GP 7
elle
était
peut-être
morte
,
mais
j'
entendais
encore
,
au
fond
du
pavillon
...
69
70
71
72
73
74
75
76
77
78
79
80
81
82
MOD_V(GR5 , F76), CPL_V(GP6 , F76)
Énoncé
2
GP 1
NV 2
NV 3
GN 4
En
quelle
année
a
-t-on
construit
la
première
automobile
?
1
2
3
4
5
6
7
8
9
10
CPL_V(GP1,F6), COD_V(GN4,NV3)
Énoncé
38
GN 1
NV 2
GP 3
NV 4
Paul
demande
à
qui
vous
pensez
.
1
2
3
4
5
6
7
COD_V(NV4,NV2), CPL_V(GP3, NV4)
C.4.I Le complément d'agent
Le complément d'agent est noté comme les autres compléments
introduits par une préposition (on ne cherche pas à rétablir
le sujet réel) :
Énoncé 9
GN 1
NV 2
NV 3
NV 4
GP 5
La
décision
a
été
prise
par
le
président
.
1
2
3
4
5
6
7
8
9
SUJ_V(GN1,NV2),CPL_V(GP5,NV4)
C.5 La relation Modifieur-Verbe : MOD_V
Cette relation concerne tous les constituants dont on peut affirmer qu'ils
sont modifieurs et non compléments du verbe. Il s'agit plus précisément
des GR et des propositions qui sont de façon évidente des
circonstants (comme les temporelles ou les causales ou encore les participiales par exemple). On y retrouve
aussi tous les GN qui ne sont pas objet direct du verbe. En revanche, pour
les GP ou les PV qui sont trop souvent ambigus face à cette catégorisation,
ils ne seront pas étiquetés par cette relation mais comme
complément_verbe.
Dans le cas de temps composés, les relations objet direct-verbe,
complément-verbe et modifieur-verbe se notent avec
la forme du verbe principal (voir B1.III) Exemples (voir aussi exemples
de COD_V et de CPL_V) :
Énoncé 22
GN 1
NV 2
GR 3
GN 4
Jean
dort
profondément
la
nuit
.
1
2
3
4
5
6
MOD_V(GR3, NV2), MOD_V(GN4,NV2)
Énoncé 23
GN 1
NV 2
GR 3
GN 4
NV 5
GA 6
Jean
ne
dort
pas
parce_que
la
nuit
est
claire
.
1
2
3
4
5
6
7
8
9
10
MOD_V(NV5, NV2), MOD_V(GR3,NV2)
Énoncé 23
GN 1
NV 2
NV 3
GR4
GP 5
Les
participants
sont
venus
,
le
cas
échéant
,
avec
leur
compagne
.
1
2
3
4
5
6
7
8
9
10
11
12
MOD_V(GR4,NV3), CPL_V(GP5,NV3)
C.6 La relation Complémenteur : COMP
La relation complémenteur est utilisée principalement pour
les subordonnées conjonctives. Elle comprend alors deux
arguments : le complémenteur et le noyau verbal de
la "proposition subordonnée". La relation avec l'élément
qui les introduit est exprimée par ailleurs: il s'agit souvent d'un
verbe dont "que Phrase" est soit objet direct (Je pense qu'il viendra),
soit un autre complément (comme une circonstancielle du type Quand
il pleut, je reste chez moi), mais il peut aussi s'agir d'un nom, "que
Phrase" est alors complément du nom (L'idée qu'il arrive
en retard), ou d'un adjectif (Il est fier qu'elle réussisse).
On utilise aussi cette relation dans le cas d'adverbe relatif (où ...), mais attention, pas pour les pronoms relatifs!
Énoncé 12
NV1
GN2
NV3
GR4
GA5
Je
pense
que
monsieur
est
très
inquiet
.
1
2
3
4
5
6
7
8
COMP(F3,NV3) et également COD_V (NV3, NV1)
Elle est aussi utilisée pour annoter la relation entre une préposition
et un groupe nominal ou un groupe verbal quand on n'a pas pu les annoter
comme groupe prépositionnel GP (Note de B.3) ou comme groupe verbal introduit par
une préposition PV(Note de B.6)
Énoncé 60
NV1
GP2
GP3
GN4
GA5
GN6
NV7
GA8
PV9
Il
arrive
en
retard
,
avec
,
dans
sa
poche
,
un
petit
discours
écrit
qu'
il
est
obligé
de
garder
.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
COMP(F6,GN4) et : CPL_V(GP2,NV1), CPL_V(GN4,NV1), MOD_N(GP3,GN4), MOD_N(GA5,GN4),
MOD_N(NV7,GN4), CPL_V(PV9,NV7), ATB_SO(GA8,NV7,s),COD_V(GN6,PV9),...
Mais dans le cas où il s'agit juste d'un adverbe qui est inclus entre
la préposition et le verbe, ils forment globalement un PV. Ceci est
vrai même dans le cas d'un adverbe complexe comme dans l'exemple
ci-dessous où "tout le temps" forme un GR complexe.
Le qu' de l'énoncé 60 (F16) est annoté
comme un GN, car il s'agit d'un pronom relatif à la différence
du que de l'énoncé 12 (F3), qui introduit la complétive
(voir C.8.I).
Dans l'énoncé 65, on trouve un PV qui modifie un GP
par l'intermédiaire d'une relation MOD-N (l'envie de ... changer),
voir C.8.
Les locutions sont annotées comme une
seule forme, on trouve alors cette forme comme source de la relation COMP.
Énoncé 23 (L782.01.03)
NV 1
GN 2
GP 3
NV 4
NV 5
GN 6
C'
est
une
solide
et
épaisse
porte
de
chêne
constituée
de_telle_sorte_qu'
elle
forme
un
bloc
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Les relations associées à l'énoncé 23
comprennent: MOD_V(NV5, NV4) et COMP(F11,NV5)
Énoncé 24
NV 1
NV 2
GN 3
GA 4
GP 5
NV 6
NV 7
NV 8
NV 9
-
imaginez
,
dis
-je
,
que
le
panneau
inférieur
de
cette
porte
ait
pu
être
ouvert
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
Énoncé 24 suite
GN 10
NV 11
NV 12
GP 13
PV 14
sans_que
la
porte
ait
été
dans
la
nécessité
de
s'
ouvrir
18
19
20
21
22
23
24
25
26
27
28
COMP(F7,NV7), COMP(F18,NV12), et : COD_V(NV7,NV1), COD_V(NV1,NV2), CPL_V(NV9,NV7),
MOD_V(NV12,NV7), MOD_N(PV14,GP13)
Pour les que intervenant dans les formes comparatives, voir D.1.XIV
C.7 La relation Attribut-Sujet/Objet : ATB_SO
La relation attribut se note entre l'attribut et le noyau verbal
permettant cette construction (voir D.3.I. Liste
des verbes introduisant un attribut du sujet). On ajoute dans la dernière
colonne l'indication s ou o pour dire s'il s'agit d'un attribut
du sujet ou de l'objet.
Énoncé 8
GN 1
NV 2
GN 3
GP 4
GP 5
Quel
était
le
nom
du
bateau
de
Jacques
Cousteau
?
1
2
3
4
5
6
7
8
9
10
ATB_SO(GN1, NV2,s)
Énoncé 11
NV1
NV2
GN3
GA4
Il
a
trouvé
cette
explication
étrange
.
1
2
3
4
5
6
7
ATB_SO(GA4, NV2,o)
Énoncé 18
NV1
GN2
GP3
Elle
traite
Jean
d'
imbécile
.
1
2
3
4
5
6
ATB_SO(GP3, NV1,o)
Énoncé 32
NV 1
PV 2
GA 3
Elle
lui
demande
d'
être
sage
.
1
2
3
4
5
6
7
ATTB_SO(GA3, PV2, s)
Quand l'élément auquel l'attribut se rapporte est omis,
on indique quand même la fonction de l'élément omis dans la troisième colonne. Exemple :
Énoncé 35
NV1
GA2
Cela
rend
fou
.
1
2
3
4
ATB_SO(GA2, NV1,o)
C.8 La relation Modifieur-Nom : MOD_N
Les modifieurs de nom sont rattachés à la forme du nom qu'ils
modifient :
Énoncé
2
GP 1
NV 2
NV 3
GN 4
En
quelle
année
a
-t-on
construit
la
première
automobile
?
1
2
3
4
5
6
7
8
9
10
MOD_N(F8 , F9)
Énoncé 8
GN 1
NV 2
GN 3
GP 4
GP 5
Quel
était
le
nom
du
bateau
de
Jacques
Cousteau
?
1
2
3
4
5
6
7
8
9
10
MOD_N( GP4, F4 ), MOD_N( GP5, F6)
Pour le GN "Jacques Cousteau", voir ci-dessous les explications pour "Desmond
Mpilo Tutu".
MOD_N(GP4,GN3), MOD_N(PV5,GP4), et : MOD_V(GR2,NV1), COD_V(GN3,NV1), , MOD_V(F11,F12), ...
De manière générale, les déterminants ne
sont pas annotés comme modifieurs du nom, sauf quand ils peuvent être
précédés d'un article.
Énoncé 2
GN 1
NV 2
NV 3
Trois
filles
sont
entrées
.
1
2
3
4
5
MOD_N(F1 , F2), car on peut dire Les trois filles....
Pour plus de détails, voir D.1.X1 Modification
et déterminants.
Cas des numérotations, complexes ou non :
Énoncé 2
GN 1
NV 2
NV 3
La
partie
II
est
finie
.
1
2
3
4
5
6
MOD_N(F3,F2)
Énoncé 2
GN1
GA2
NV3
NV4
Les
parties
II.3
et
III.4
sont
écrites
.
1
2
3
4
5
6
7
8
COORD(F4,GN1,GA2), MOD_N(F4,F2) (Pour plus d'informations sur la coordination, voir relation de coordination)
A noter :
Pour les GN du type
GN 1
Desmond
Mpilo
Tutu
3
4
5
ou :
GN 1
San
Francisco
6
7
nous considérons qu'il est difficile
de décider des relations de modification et de leur sens. Nous avons
donc décider par convention d'annoter les relations de modification "en
cascade" :
Relations modifieur - nom
modifieur
nom
F3
F4
F4
F5
et :
modifieur
nom
F6
F7
C.8.I Annotation des relatives
La relation antécédent de pronom relatif n'est pas
annotée en tant que telle. Mais pour indiquer à quel élément
se rapporte la relative, on utilise la relation MOD_N entre le verbe principal
de la relative et l'élément auquel elle se rapporte. Si cet
antécédent est absent, la relative remplace un groupe nominal
et sera annotée comme telle (voir D.1.IX
Relatives sans antécédent. Quand la relative n'a pas de
verbe (Il a trois enfants dont deux filles), voir D.1.VIII Phrases et propositions sans verbe.
D'autre part, l'annotation du pronom relatif est analogue à
celle qui serait faite pour l'objet qu'il remplace (GN pour "qui", GP pour
"où", ...).
Les modifieurs d'adjectif sont rattachés à la forme de l'adjectif
qu'ils modifient. Veiller à ne pas oublier les modifieurs d'adjectif
quand ils sont dans un GN sans nom (voir aussi : D.1.III
Phénomènes de transcatégorisation ).
Exemples :
Énoncé
39
GN 1
NV 2
GA 3
GP 4
La
mère
est
fière
de
son
fils
.
1
2
3
4
5
6
7
8
MOD_A(GP4, GA3)
Énoncé
37
GN 1
NV 2
GA 3
NV 4
NV 5
GN 6
La
mère
est
fière
qu'
il
ait
réussi
son
examen
.
1
2
3
4
5
6
7
8
9
10
11
MOD_A(NV5, GA3), COMP(F5,NV5)
Énoncé
38
GN 1
GP 2
NV 3
GN 4
La
plus
belle
de
la
collection
est
la
verte
.
1
2
3
4
5
6
7
8
9
10
MOD_A(F2,F3), MOD_A(GP2, F3)
Pour l'annotation des formes comparatives et superlatives, voir D.1.XIV
C.10 La relation Modifieur-Adverbe : MOD_R
Les modifieurs d'adverbe sont rattachés à la forme de l'adverbe
qu'ils modifient.
Exemple :
Énoncé
10
NV1
NV2
GR3
GR4
Il
m'
a
reçue
très
gentiment
.
1
2
3
4
5
6
7
MOD_R(F5, F6)
C.11 La relation Modifieur-Préposition : MOD_P
Les modifieurs de préposition sont rattachés à la
forme de la préposition qu'ils modifient.
Exemple :
Énoncé
36
NV1
GR2
GP3
GP4
Il
arrive
peu
avant
le
début
du
cours
.
1
2
3
4
5
6
7
8
9
MOD_P(F3,F4)
C.12 La relation de Coordination : COORD
Le premier élément de la relation de coordination
est le coordonnant. Comme les conjonctions de subordination, celui-ci
n'est inclu dans aucun groupe (i.e. il n'est pas annoté lors de la
phase d'annotation en constituants).
S'il s'agit d'une coordination de groupes, les numéros des deux
groupes coordonnés sont indiqués en position 2 et 3 de la relation.
S'il s'agit d'une coordination de propositions, c'est le numéro du
NV principal de chaque proposition qui est utilisé. Par exemple :
Énoncé
22
GN 9
GN 10
GP 11
NV 12
les
pleurs
et
les
jérémiades
des
deux
concierges
recommencèrent
.
17
18
19
20
21
22
23
24
25
26
COORD (F19,GN9,GN10)
Énoncé
6
GN1
NV2
GN3
GP4
GA5
GP6
NV7
GN8
Quel
était
le
nom
de
la
série
télévisée
,
dans
laquelle
jouait
Karl
Malden
,
et
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
Énoncé
6
GN9
NV10
GN11
GP12
qui
avait
San
Francisco
dans
son
titre
?
17
18
19
20
21
22
23
24
COORD (F16, NV7, NV10)
Énoncé
7
GN 1
Mon
très
cher
et
très
grand
ami
.
1
2
3
4
5
6
7
8
COORD (F4, F3 , F6)
Le cas de la coordination de deux adverbes ne pose pas de problème
particulier :
Énoncé
8
GN1
NV2
GR3
GR4
GR5
GR6
Emma
mange
très
vite
et
fort
proprement
.
1
2
3
4
5
6
7
8
COORD (F5, F4 , F7) ou COORD (F5, GR4 , GR6)
A noter :
Les cas de coordination de deux GN introduits
par la même préposition sont annotés de la façon
suivante: les jeunes filles arboraient donc un fichu étroitement noué
sous le menton <GP> dans les couloirs</GP>
et <GN>la cour</GN>
<GP> de récréation</GP>,
avec une relation complémenteur entre la préposition et le
GN qui est le deuxième coordonné ; on notera : COORD(et,
GP, GN )
Lorsque des éléments coordonnés sont la cible (resp. la source)
d'une relation syntaxique, c'est la conjonction de coordination seule qui
sera identifée comme cible (resp. source) de cette relation. Ainsi, dans l'exemple
précédent, on notera le complément circonstanciel du
verbe comme : CPL_V( et,arboraient ).
Dans le cas de coordinations enchaînées, la coordination
à l'étape n+1 a pour premier coordonné le second coordonné
de la coordination de l'étape n.
Dans les cas de coordinations enchaînées, quand elles sont source
ou cible d'une relation, on décidera par convention de noter le dernier
coordonnant comme source ou cible de la relation (voir les exemples
ci-dessous).
Dans certains cas particuliers, la relation de coordination peut
n'avoir que deux arguments (la conjonction et un coordonné) au
lieu des 3 habituels. c'est le cas lorsque l'un des coordonnés est absent, comme
lorsqu'une phrase commence par une conjonction de coordination :
"Et Marie le jeta." COORD(et,,jeta)
Dans les cas d'énumérations longues, on ne coupe pas les énoncés, et quand il s'agit manifestement
d'une coordination, les différents éléments énumérés sont liés par une
relation de coordination, sinon elles seront juxtaposées (voir C.14.I Enumérations juxtaposées)
Exemple : Pour allumer votre appareil, vous devez :
brancher l'alimentation dans la prise au dos de l'appareil,
puis relier cette alimentation au secteur,
et appuyer sur l'interrupteur.
COORD(puis, brancher,relier), COORD(et, relier, appuyer), COD_V(et,devez)
Quand ce ne sont pas des coordinations marquées, les énumérations sont considérées comme des juxtaposition (voir ci-dessous).
C.12.II Les coordinations de coordinations
Certaines coordinations sont enchâssées les unes dans les autres. Dans
ce cas chacune est annotée en suivant les principes énoncés
précédemment.
Exemple :
Énoncé
6
GN1
GA2
GA3
GN4
GA5
GN6
GA7
GA8
GN9
GA10
NV11
GN12
GP13
Les
volets
bleus
et
verts
,
les
maisons
blanches
,
le
ciel
bleu
et
blanc
et
les
forêts
vertes
forment
le
paysage
de
l'
île
.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
COORD(F4,GA2,GA3), COORD(F14,GA7,GA8), COORD(F6,GN1,GN4), COORD(F10,GN4,GN6), COORD(F16,GN6,GN9) et
MOD_N(F4,GN1), MOD_N(GA5,GN4), MOD_N(F14,GN6), MOD_N(GA10,GN9) et
SUJ_V(F16,NV11)
C.13 La relation d'Apposition : APP
La relation d'apposition est une relation à 2 arguments de type
GN le plus souvent : l'élément apposé (le deuxième) et celui auquel
il s'appose (le premier). Elle marque l'identité entre les référents
de ces deux GN. Lorsqu'ils existent, les marqueurs d'apposition, comme par
exemple les virgules, sont ignorés. Dans les cas de GN consécutifs,
sans marque explicite d'apposition, il peut y avoir un doute entre modifieur
du nom et apposition. Pour distinguer entre ces deux cas, on pourra essayer
d'intervertir les groupes : si c'est possible, alors il s'agit d'une apposition,
sinon, d'un modifieur de nom.
Quand le premier GN est une action, le second peut être une proposition qui explicite l'action (voir un exemple dans C.14.I).
Enoncé 9
GN 1
GN 2
NV 3
GR 4
Le
principal
,
Mr
Ernest
Chenière
,
n'
en
démord
pas
.
1
2
3
4
5
6
7
8
9
10
11
12
APP(GN1,GN2)
Enoncé 13
GN 1
GN 2
NV 3
GP 4
Le
député
Yves
Tavernier
participe
au
débat
.
1
2
3
4
5
6
7
8
APP(GN1,GN2). En effet, on peut dire "Yves Tavernier, député ,...".
Enoncé 103
GN 1
GA 2
GN 3
NV 4
GP 5
Le
système
européen
Galiléo
sera
exploité
vers
2013
.
1
2
3
4
5
6
7
8
9
APP(GN1,GN3) et MOD_N(GA2,GN1). En effet, on peut dire "Galiléo, système européen ,...".
En revanche :
Enoncé 13
GN 1
GN 2
NV 3
GP 4
Le
député
PS
participe
au
débat
.
1
2
3
4
5
6
7
MOD_N(GN1,GN2), car on ne peut pas faire l'inversion entre "PS" et "député", qui de plus n'ont pas le même référent.
C.14 La relation de Juxtaposition : JUXT
La relation de juxtaposition est utilisée pour les constituants
qui ne sont ni subordonnés ni coordonnés ni apposés.
Elle relie deux éléments. Dans les cas d'énumération plus longue,
les juxtapositions seront notées de proche en proche. Lorsque ce sont
des constituants ou des formes qui sont juxtaposées son fonctionnement
est trivial ; mais lorsque ce sont des constructions complexes, par exemple
des propositions, alors ce sont les premiers noyaux verbaux de chaque proposition
qui portent la relation. Lorsqu'ils existent, les marqueurs de juxtaposition,
comme par exemple les virgules ou les tirets, sont ignorés.
Enoncé 1
GN 1
NV 2
GN 3
NV 4
GA 5
L'
administration
se
fâche
,
certains
enseignants
se
déclarent
"
choqués
"
.
1
2
3
4
5
6
7
8
9
10
11
12
13
JUXT(NV2,NV4)
On trouvera plusieurs exemples de juxtaposition dans l'exemple traité
en annexe.
C.14.I Les énumérations juxtaposées
Lorsque
les énumérations ne sont pas marquées par des coordinations, elles sont
reliées par une relation JUXT, qui peut inclure d'autres juxtaposition
(ou coordination).
Si toutes les juxtapositions interviennent comme source ou cible d'une
relation, la relation sera par convention indiquée sur le premier
élément de la suite de juxtaposition.
Exemple : Lors de la réunion, ont été prises les décisions suivantes :
C.15 Table récapitulative sur l'annotation des relations
La table suivante récapitule les informations mentionnées
ci-dessus. Elle indique la nature des constituants qui peuvent être
arguments pour chaque relation.
A noter :
un constituant (GN,
NV, GP, GA, GR, PV) peut être
remplacé par la forme lui correspondant;
il est évident que pour annoter les relations dont la source
et la cible sont dans le même constituant, il est impératif
d'utiliser les formes;
dans le cas particulier de proposition sans verbe, le NV peut être
remplacé par un syntagme d'une autre nature : ceci n'est pas pris en compte dans la grille suivante (voir D.1.VIII Phrases et propositions sans verbe)
Tout constituant peut être remplacé par
une forme coordonnante dans le cas où le constituant est remplacé par
une coordination de ce type de constituants (C.12 La relation de coordination)
``Corpus Le Monde Annotations en constituants - Guide pour
les correcteurs'' mise à jour en octobre 2001,de Anne Abeillé,
Francois Toussenel, Martine Chéradame,
"Guide pour les annotateurs - mots simples. Corpus Le Monde"
mise à jour de novembre 1999, Anne Abeillé et Lionel Clément.
"FORMAT DE DESCRIPTION LEXICALE POUR LE FRANÇAIS - partie
2 : Description morpho-syntaxique", rapport interne projet CNRS GRACE
(Grammaires et Ressources pour l'Analyse de Corpus et l'Evaluation) GTR-3-2.1,
30 Juin 1997, M. Rajman (EPFL), J. Lecomte (INaLF), P. Paroubek (INaLF)
"Le Bon Usage", Grévisse et Goose, 12ème édition,
Ed. Duculot, 1986,
"Nouvelle Grammaire Française", Grévisse et Goose,
3ème édition, Ed de boeck, 1995
"Grammaire du français contemporain",édition
révisée en 2002, Ed. Larousse, J.C. Chevalier, C. Blanche-Benveniste,
M. Arrivé, J. Peytard
"Grammaire méthodique du français" 1994, Ed.
PUF,M. Riegel, J.C. Pellat, R. Rioul
D.1 Remarques générales
Cette partie réunit des remarques diverses, qui permettent d'approfondir
ou de préciser certains points évoqués précédemment,
dans un ordre qui n'a pas de réelle signification.
D.1.I Pas de constituants discontinus ou croisés
On fait l'hypothèse qu'on n'a pas de constituants discontinus ni de syntagmes
croisés. La plupart du temps, quand on a l'intuition d'un syntagme discontinu
c'est parce que plusieurs éléments participent d'une même fonction. Ceci est
noté au niveau des relations. De ce fait, il peut y avoir deux relations
sujet - verbe pour un même verbe ( v. exemple ci-dessous.)
Quelques exemples, qui pourraient laisser penser qu'on a besoin de constituant
discontinu: Voir Noyau verbal, "A noter"
Énoncé 16
GN
1
NV 2
GN 3
NV 4
GP
5
Les
enfants
ont
tous
été
au
cinéma
.
1
2
3
4
5
6
7
.
Dans l'énoncé 16, on pourrait aussi imaginer un constituant regroupant les
enfants et tous car tous peut appartenir au GN comme dans
tous les enfants; mais ici l'ordre est inverse et on a aussi Ils
sont tous venus et dans ce cas on ne peut pas avoir de séquence * ils
tous ni * tous ils. Donc on ne fait pas de constituant discontinu
et on ne regroupe pas le quantifieur flottant avec le GN ou le clitique avec
lequel il est coréférent. Cependant, deux relations sujet - objet sont
à annoter :
SUJ_V(GN1,NV 2) et SUJ_V(GN 3,NV 2)
Énoncé 17
GN 1
NV
2
GN 3
Paul
en
mange
trois
.
1
2
3
4
5
Dans le cas, des objets du type Paul en mange trois (Enoncé 17), il
est vrai que en comme trois participent de la fonction objet,
mais on ne peut faire de constituant discontinu car la séquence * en trois
est impossible. Donc on note deux relations objet direct-verbe mais on ne
fait pas de GN discontinu au niveau syntagmatique :
COD_V(F2,F3), COD_V(GN3,F3)
Idem pour Combien veux-tu de pommes (Enoncé 18) :
Énoncé 18
GN 1
NV
2
GN
3
Combien
veux
-tu
de
pommes
?
1
2
3
4
5
6
COD_V(GN 1,F2), COD_V(GN 3,F2)
D.1.II Pas d´éléments vides
On ne note pas de catégorie vide pour les constituants absents ou "déplacés"
mais on indique explicitement les doubles relations:
Énoncé 20
NV
2
NV 3
Je
le
laisse
entrer
.
1
2
3
4
5
Dans je le laisse entrer (Enoncé 20), le est à la fois objet
de laisser et sujet d'entrer. SUJ_V(F1,F3), SUJ_V(F2,F4), COD_V(F2,F3)
On ne note pas non plus de catégorie vide pour les syntagmes elliptiques
ou "sans têtes".
D.1.III Phénomènes de transcatégorisation.
Pour l'étiquetage lexical, on évite de recatégoriser les mots qui n'ont pas
leur fonction canonique. Tous les noms employés comme épithète (un ingénieur
maison,un pays candidat, un pays membre) ou
comme attribut (il est très famille) sont malgré tout considérés comme
des noms car ils n'ont pas toutes les propriétés des adjectifs (pas d'accord
en genre et nombre).
De même les adjectifs têtes de GN elliptiques (une rouge, les meilleurs)
gardent leur statut d'adjectif car il s'agit d'un tour productif. De ce fait,
on peut avoir des GN sans Nom (voir exemples ).
De même, on ne crée pas de GA à tête nominale (i.e. sans Adjectif), car on
autorise les GN à avoir la fonction épithète ou attribut.
On ne crée pas de GR à tête adjectivale, car on autorise les GA à être mobiles
dans la phrase (c'est à dire qu'on découpe: laver plus blanc, comme
partir content, ou voter utile).
Notons que dans les tours elliptiques (.... que toi, ou dont trois
idiots), on peut trouver des phrases sans verbe
.
Exemples :
C'est <GN>un ingénieur maison</GN>.
Il est <GN>très famille</GN>.
D.1.IV Pas d'ambiguïté résiduelle
Nous avons fait l'expérience qu'une lecture suffisamment attentive permettait
toujours de désambiguer les phrases du corpus. Dans certains cas, il ne faut
pas hésiter à faire appel à des connaissances encyclopédiques.
Exemple:
Pour savoir si on a un ou deux GN coordonnés dans les phrases suivantes,
il faut savoir si Bill Clinton est ou non maire de New York
(respectivement président des Etats-Unis). Dans la première phrase
de l'exemple suivant, nous avons deux coordinations, alors que dans la seconde
nous avons une apposition et une seule coordination.
<GN id=1> Bill Clinton </GN>
, <GN id=2> le maire </GN>de
New York et <GN id=3> Madeleine Albright
</GN> COORD( ",", GN1, GN2 ) COORD( "et", GN2, GN3 )
<GN id=1> Bill Clinton </GN>
, <GN id=2> le président </GN>des
Etats-Unis , et <GN id=3> Madeleine Albright
</GN> APP(GN1, GN2) COORD( "et", GN1, GN3)
Dans certains cas, l'annotateur a le choix entre deux découpages, avec exactement
la même interprétation. Si les tests syntaxiques (pronominalisation, clivée,
et c'est que...) ne permettent pas de faire de distinction, on optera pour
la solution qui comporte le moins d'enchâssements.
D.1.V Les syntagmes unaires
On considère que certaines catégories peuvent projeter des syntagmes à elles
toutes seules. On dit qu'on a affaire à des syntagmes unaires. C'est le cas
des pronoms (non clitiques), des verbes, des adjectifs, mais ce n'est pas systématique.
Les pronoms non clitiques (tout, qui, certains etc.) employés seuls
projettent toujours des syntagmes unaires.
Les noms propres employés seuls projettent presque toujours un syntagme unaire,
sauf dans les séquences prénom nom (où on fait un seul GN).
Les verbes employés seuls projettent toujours un syntagme NV (ils peuvent
être remplacés par clitique + verbe)
Les adverbes autres que de négation forment systématiquement un syntagme
unaire.
D.1.VI Négation et anaphore
Nous ne notons (portée, ...) pas la négation, que nous considérons être un phénomène
sémantique.
De même, les antécédents des pronoms ne sont pas notés (pour le pronom relatif,
l'antécédent peut se retrouver grâce à la relation de modifieur de nom mise
en jeu.). De plus, les relations de dépendance ne dépassant pas la portée
d'un énoncé (sauf pour les cas exceptionnels, D1.XII
Dépendances entre énoncés), il est généralement impossible de retrouver
le référent d'un anaphorique.
D.1.VII Incises dans la parole rapportée
Quand le texte contient de la parole rapportée, le découpage en énoncés ne tronçonne
pas les morceaux de parole rapportée avec les incises telles que "dit xx". Cela
permet de marquer les relations entre éléments qui sinon seraient dans des énoncés
différents.
On annote également la relation entre le verbe en incise et la parole rapportée,
si c'est nécessaire.
Exemple :
Enoncé 5
NV
1
GN 2
NV 3
GN 4
NV
5
GN
6
GP
7
-
vous
prétendez
,
monsieur
,
dit
celui-ci
que
vous
connaissez
le
mobile
du
crime
?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
COD_V(NV5,F3), COD_V(NV1,NV3),...
D.1.VIII Phrases ou propositions sans verbe
Lorsque la phrase sans verbe se réduit à un syntagme (nominal, prépositionnel),
il n'y a pas de problème particulier. En revanche, il faut résoudre les cas
où le verbe est absent de la subordonnée, alors que l'on devrait utiliser le
noyau verbal de celle-ci pour annoter les relations. Quand cela est possible
(c'est-à-dire quand la proposition se réduit à un seul syntagme), on utilisera
alors le constituant présent à la place du noyau verbal.
Enoncé 5
NV 1
PV 2
GP 3
NV 4
GP 5
Je
répondis
,
sans
savoir
à
quoi
je
m'
engageais
:
«
Dans
huit
jours
.
»
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
COD_V(GP5,NV1),...
Enoncé 48
NV
1
GN
2
GP 3
GN
4
Il
a
trois
enfants
dont
deux
filles
.
1
2
3
4
5
6
7
8
MOD_N(GN4,GN2), MOD_N(GP3,GN4),...
Quand il s'agit de formes elliptiques, on peut résoudre l'ellipse, comme
dans l'exemple suivant. Concernant la coordination, le troisième argument,
qui devrait pointer sur le NV de la seconde proposition, pointe alors sur
le premier constituant de celle-ci (en l'occurence le GN).
Lorsque la relative n'a pas d'antécédent, elle joue le rôle d'un nom. Exemple
:
Enoncé 50
NV 1
GN 2
NV
3
Choisis
qui
tu
veux
!
1
2
3
4
5
COD_V(NV3,NV1), SUJ_V(F3,F4),COD_V(GN2,NV3)
Enoncé 46
GN 1
NV 2
GN
3
GP
4
NV
5
Paul
donne
son
livre
à
qui
le
veut
.
1
2
3
4
5
6
7
8
9
SUJ_V(GN1,NV2), COD_V(GN3,NV2), CPL_V(NV5,NV2), SUJ_V(F6,NV5), COD_V(F7,F8)
A noter : on note de préférence la relation sujet au sein de la relative sur
la forme qui plutôt que sur le constituant qui se trouve être alors un
GP.
D.1.X Eléments en langue étrangère, formules, références et équations
Il est possible de rencontrer dans les corpus des éléments en langue étrangère,
des formules, des équations mathématiques ou chimiques. Ils
sont regroupés dans des constituants, mais on n'annotera pas alors de relation
interne au constituant. Les références bibliographiques au sein de textes (comme
dans les articles) seront traitées de la même façon.
SUJ_V(GN1,NV5), MOD_A(GR2,GA3), MOD_N(GA3,GN1), APP(GN4,GN1), AUX_V(NV5,NV6),
CPL_V(GP7,NV6)
A noter : la référence bibliographique, qui vient justifier l'argument, est
considérée comme une apposition.
D.1.XI Modification et déterminants
Nous avons vu que généralement les déterminants ne sont pas annotés comme modifieurs
du nom (on n'annote pas la relation entre le et chat dans <GN>le
chat</GN>). Cependant, on annote les numéraux comme modifieurs,
comme dans :
Enoncé 49
NV
1
GN
2
Il
a
trois
enfants
.
1
2
3
4
5
MOD_N(F3,F4)
De manière générale, on annote les relations de modifieurs entre les déterminants
qui peuvent être précédés d'un article et le nom qu'ils modifient (même si
dans la phrase courante il n'y a pas d'article). Ainsi, ils seront annotés
de façon analogue à des numéraux plus complexes comme :
Enoncé 47
GN
1
GP
2
NV
3
NV 4
Une
centaine
d'
opposants
se
sont
rassemblés
.
1
2
3
4
5
6
7
8
MOD_N(GP2,GN1), SUJ_V(GN1,NV3)
On notera dans cet énoncé (47), que la relation sujet est notée entre le GN
et l'auxiliaire, même si les règles d'accord ne sont pas respectées (l'accord
se faisant sur des critères plutôt sémantiques).
Des formes plus complexes de déterminants seront annotés comme ci-dessous
:
De même, les composants des grands nombres
sont attachés individuellement au nom. Ainsi, dans "il a trois
cents livres", "trois" est relié par une relation MOD-N
au nom "livres". Il en est de même pour "cents".
A noter: autour de, près de, quand ils précèdent un numéral
peuvent être employés comme sujet et seront notés comme des déterminants(<GN>Autour
de dix personnes</GN> sont entrées<GN>,Près
de vingt personnes</GN> sont venues), alors qu'ils sont considérés
comme des prépositions dans ils mangent <GP>autour
de la table</GP>, ils viennent <GP>près
de toi</GP>.
D.1.XII Dépendances entre énoncés
La segmentation entre énoncés est supposée correcte, et nous avons dit jusqu'ici
que les annotations des relations se faisaient à l'intérieur d'un même énoncé,
regroupant parfois plusieurs phrases (voir D.1.VII
Incises dans la parole rapportée).
On n'essaiera jamais d'annoter des relations entre
un anaphorique et son référent s'il est dans un autre énoncé, par exemple.
On peut noter également que lorsque une coordination est en début d'énoncé,
on peut la noter en ne notant que l'un des coordonnés (l'autre restant vide),
voir la quatrième note à la fin du C.12 La relation
de coordination.
D.1.XIII Clivées, pseudo-clivées, impersonnels et autres formes...
Dans toutes ces formes, comme pour le passif (voir C.1 La relation sujet verbe), on ne cherchera pas à rétablir
des relations "profondes" qui peuvent varier d'une théorie à une autre, en revanche
on établira tous les liens nécessaires à la mise en application de ces théories.
Nous restons donc au niveau d'une analyse de surface :
Dans les cas courants de formes superlatives telles que "Julie est la
plus grande fille", on annote tout l'ensemble dans un seul groupe GN.
Pour l'annotation des comparatifs on suivra la convention suivante : on
annote en différents groupes quand la construction comparative peut
commuter avec un adjectif seul, sinon on annote comme un GN.
Énoncé 109
GN1
NV2
GN3
Julie
est
la
plus
grande
fille
.
1
2
3
4
5
6
7
MOD_N(F5,F6), MOD_A(F4,F5), ATTB_SO(GN3,NV2,s)
Énoncé 89
GN1
NV2
GR3
GA4
GN5
Pierre
est
plus
grand
que
Paul
.
1
2
3
4
5
6
7
COMP(F5,GN5), MOD_A(GR3,GA4), MOD_R(GN5, GR3), ATTB_SO(GA4,NV2,s)
L'adverbe modifie le GA, le GN qui suit le que (qui sert de base à la comparaison),modifie le GR. Cet élément peut prendre des formes autres qu'un GN :
<GN> Robert </GN> <NV> arrivera </NV> <GR> après-demain </GR>
<GN> Robert </GN> <NV> promet </NV> <GP> pour demain </GP>
Et pour les cas plus complexes :
Énoncé 108
GN 1
NV 2
GN3
GN4
Robert
arrive
lundi
soir
.
1
2
3
4
5
MOD_N(GN4,GN3), MOD_V(GN3,NV2)
Énoncé 109
GN 1
NV 2
GR3
GN4
Robert
arrive
demain
matin
.
1
2
3
4
5
MOD_R(GN4,GR3), MOD_V(GR3,NV2)
Énoncé 110
GN 1
NV 2
NV 3
GR4
GP5
Il
est
venu
hier
au
soir
.
1
2
3
4
5
6
MOD_R(GP5,GR4), MOD_V(GR4,NV3)
Énoncé 111
GN 1
NV 2
GR 3
GR4
GN5
Il
travaille
très
tard
le
soir
.
1
2
3
4
5
6
MOD_R(GR3,GR4), MOD_N(GR4,GN5), MOD_V(GN5,NV2)
Énoncé 112
GN 1
NV 2
GP 3
Elle
se
réveille
en
pleine
nuit
.
1
2
3
4
5
6
MOD_N(F5,F6), CPL_V(GP3,NV2)
D.2 Quelques indications pour résoudre les cas difficiles
La forme de est l'une des formes
les plus fréquentes du francais. Elle peut être préposition,
donnant ainsi lieu à un GP ou un PV. Elle peut être déterminant
donnant alors lieu à un GN. Enfin, elle peut être complémenteur.
Dans ce cas, nous ne l'inclurons dans aucun groupe (comme c'est le cas pour
la conjonction de subordination que).
La forme de est préposition lorsqu'elle introduit un complément
d'objet indirect (argument d'un verbe transitif indirect), un complément
de nom ou d'adjectif, ou un complément circonstanciel. Exemples:
Il travaille de ses mains
La maison de Paul
Il est fier de lui
Il vient de chez lui
une pomme de trop
s'il est suivi d'un nom commun sans déterminant, il
commute avec un déterminant (le, la, un, une)
, dans ce cas de est déterminant indéfini ou partitif.
Exemples:
Je ne vois pas de chien
(je ne vois pas un chien)
je n'ai pas d' argent
(l'argent)
Je n'ai plus de monnaie
(la monnaie)
Personne ne prendra de décision
(= une décision précise)
si le nom qui suit deest
pluriel (le groupe peut être pronominalisé par en), de est préposition.
Exemples:
Je rêve de beaux enfants
je veux plus de profits
si de introduit un verbe à l'infinitif, alors
la forme de est une préposition, et on annotera l'ensemble
comme un PV
Je viens de finir
Il essaie de les encourager
sinon de est complémenteur, comme dans les
exemples suivants :
J' en ai une de cassée
j'ai un fils de malade
La forme des peut être soit
un déterminant partitif ou bien une
préposition agglutinée à
un déterminant.
un communiqué des plus
étonnants
Je ne me souviens pas des
(de+les) vacances
La forme du peut être un déterminant partitif ou bien une préposition agglutinée à un
déterminant. Exemples :
Du(de+le) balcon on
voit la lune
La nomination du (de+le)
Président
Il est fier du (de+le) résultat
Jean fait du (de+le) le vélo
(= de ce vélo)
Jean joue du (de+le) piano
(= de ce piano)
Il tombe du (de+le) train
(= de ce train)
Il boit du (de+le) champagne
(= un excellent champagne)
La forme que peut être conjonction
de subordination, pronom relatif ou interrogatif, déterminant exclamatif,
ou bien encore adverbe
Distinction entre adjectif et participe passé
En complément de B.1.II Participes-adjectifs,
après les verbes "paraître" et "sembler", une
forme de participe passé est adjectif (GA
et non NV), par exemple :
M Robert Darzac parut <GA> agité
</GA> (extrait de "Le mystère de la chambre jaune").
Attention cependant : celle-ci paraît avoir renoncé, au moins provisoirement, à
son objectif (extrait de "Le mystère de la chambre jaune")
dans ce cas "paraître" est suivi d'un infinitif passé
formé du verbe avoir à l'infinitif et du participe passé
de renoncer.
Exemples :
celle-ci paraît <NV>
avoir </NV><NV> renoncé </NV>
, au moins provisoirement , à son objectif
Je pus croire, un moment, qu' il en était <NV> aimé </NV>
La forme tout peut être pronom, déterminant ou adverbe.
Exemples :
ces volets ne se sont pas fermés <GR> tout </GR> seuls (extrait
de "Le mystère de la chambre jaune")
<GN> Tout </GN>
<NV> prouve </NV> que <NV>vous étiez </NV> <GR>dehors</GR>, <GP> près du pavillon</GP>.
(extrait de "Le mystère de la Chambre Jaune")
<GN>Tout homme</GN>
est mortel.
Les présentatifs sont annotés
comme des NV :
Les formes c'est, ce n'est (...pas), ce sont. Rappel : le pas
est lui à l'extérieur du NV
Exemple:
<NV>c'est</NV>une solide* et épaisse porte de chêne ... (extrait
de "Le mystère de la chambre jaune")
c'est est considéré comme un "présentatif".
Il sera noté NV, idem pour ce
sont, ce n'est (...pas), qu'est-ce,etc.
La forme il y a :
Exemple : <NV> Il y a <NV>
une dame qui vous attend., <NV> Il n'y
avait <NV> personne dans la salle.Une relation CPL_V est
alors notée entre le y et la forme de avoir
Les
formes voilà, voici :
Exemple : <NV> voilà <NV>
ce que j'ai trouvé (extrait de "Le mystère de la chambre
jaune")
est considérée comme un "présentatif". Elle sera notée
NV, de même que la forme voici
Pour des exemples des annotations en dépendance de ces cas, voir
D1.XIII Clivées, pseudo-clivées, impersonnels
et autres formes....
La forme comme
est considérée comme un complémenteur :
comme n'est donc généralement pas inclus dans un
constituant, mais est la source d'une relation COMP. Cependant, comme pour
toutes les prépositions qui introduisent un groupe prépositionnel,
on notera (par raccourci) comme groupe prépositionnel le constituant
formé de comme + GN (voir B.3 Groupe
Prépositionnel).
<GN> toutes </GN>
<NV> racontaient </NV> <GN> des passions </GN> <GA> énergiques </GA> mais <GA> diverses </GA> comme <NV> l' étaient </NV> <GN> leurs beautés </GN>
COMP(comme,étaient)
<NV> Il s'affirme </NV> <GP> comme chef</GP>
<NV> Il se
comporte </NV><GP> comme un chef
</GP>
La forme dont est un pronom relatif
qui remplace un GP, il est donc annoté GP.
Exemple: M Darzac , <GP> dont
</GP> la pâleur , à ce moment , me parut tout
à fait anormale(extrait de "Le mystère de la chambre jaune")
Notons que la forme que peut être séparée du
verbe, c'est à dire qu'elle ne sera pas incluse dans le constituant
<NV>. Dans le cas de si on compare ne ... que à seulement
et ne .. rien, sinon,, que est adverbe, il forme donc un GR.
Voir le paragraphe sur les adverbes de négation
discontinus car ne ... que est un négation exceptive ou
restrictive.
Le cas de ni ... ni, et ... et , autant... autant...
Exemple : <NV> Elles ne différaient
</NV> ni <GP> par les mots </GP>
ni <GP> par les idées </GP>
(corpus ABU), c'est une conjonction de coordination de constituants
négatifs, la locution reste en dehors des constituants. Pour
l'annotation en relation, on notera la coordination entre les deux
syntagmes, et on notera le second ni comme coordonnant : le premier sera ignoré : COORD(ni, par les mots, par les idées). Il en est de même quand la conjonction et est répétée (Elle aime et les pommes et les poires.)
On utilisera aussi cette annotation pour les formes telles que Autant <GN>Paul </GN> <NV>est</NV> <GA>gentil </GA>, autant <GN>Pierre </GN> <NV>est</NV> <GN>une fripouille</GN>, en annotant une relation COORD(autant, est, est), avec le second autant, le premier restant non annoté..
La forme où, quand il s'agit du pronom relatif, remplace
un GP (comme dont), elle est donc notée comme tel.
Pour les autres cas, voir pourquoi, quand, comment, où
Exemple : <GN> la petite chambre </GN>
<GP> où <GP> <NV> vous dormiez <NV>... (extrait
de "Le mystère de la chambre jaune")
Les
formes oui, non, ...
Elles sont annotées comme des adverbes, qu'elles remplacent une
phrase complète ou juste une proposition, ou qu'elles s'appliquent
à un nom.
Exemples :
<GR>oui</GR> , <NV> fit </NV> <GN>
le professeur </GN> (extrait de "le mystère de la
chambre jaune")
Elle dit que <GR>non</GR>
Des débiteurs <GR>non</GR>
solvables.
Il en est de même pour pas, ou point. Exemples :
Des leçons <GR>pas</GR>
apprises.
Des daims <GR>point</GR>
trop sauvages.
Les formes pourquoi, quand , comment, où:
Ces formes peuvent être soit des adverbes interrogatifs quand ils sont
en début de phrase interrogative, soit des complémenteurs quand ils
introduisent une proposition. Quand ils sont adverbes, ils sont annotés
comme tels, et modifient le verbe principal de la question. Exemples :
<GR>Pourquoi</GR> <NV> continuez-vous </NV><PV> à mentir </PV>
(extrait de "Le mystère de la chambre jaune")
<GR>Où</GR> <NV> vas-tu </NV>?
Quand ils introduisent une proposition, ils sont complémenteurs , et,
au même titre que ceux-ci, ne sont pas considérés lors de l'annotation
en constituants. La relation avec le verbe de la principale est annotée
ensuite comme un MOD_V.
Exemples :
Quand <NV> il pleut </NV>
<NV> je ne sors </NV><GR>pas</GR>.
<NV> J'irai </NV>où<NV> tu iras </NV>.
Les pronoms clitiques :
Ce sont les mots : je, tu, il, nous, vous, ils, me, te, lui, leur, y, en, le, la, ceci, cela, ça, ce
quand ils sont intimement associés au verbe.
Exemples :
<NV> il mange </NV>.
<NV> ça va </NV>.
Il part <GP> avec nous </GP>.
Il faut que <NV> ce soit </NV> clair.
La forme "pas moins" :
Dans "Il ne s'en rend pas moins compte", "pas" et "moins" forment deux GR. Le premier se rattache
au noyau verbal via une relation MOD-V. Le second se rattache au groupe nominal via une relation MOD-N.
Pronoms réfléchis:
Dans une formulation comme "Je me lave.", on indique une relation
COD-V entre "me" et "lave" car il s'agit du verbe "laver".
En revanche, dans "Je me souviens", il n'y a aucun relation à
décrire entre "me" et "souviens" car il s'agit
du verbe "se souvenir".
D.3. Quelques listes pour résoudre les cas difficiles
Pour résoudre une certain nombre de cas, nous donnons une liste
des éléments partageant une caractéristique donnée.
D.3.I Listes des verbes introduisant un attribut du sujet
Les verbes suivants se construisent avec un attribut du sujet :
être
devenir, redevenir, passer (Il est passé chef.), se
faire (Il se fait rare.), tomber (Il tombe malade)
sembler, paraître, s'annoncer ( Le temps s'annonce splendide.)
rester, demeurer
se montrer ( il se montre nerveux.), s'avérer, se trouver
les verbes au passif qui sont la transposition de tours actifs où
l'attribut se rapporte au cod : Il est nommé capitaine qui
transpose Il nomme Jean capitaine
les verbes pronominaux à sens passif : Il s'appelle Jean
certains attributs sont précédés d'une préposition
ou de comme : passer pour, apparaître comme, se transformer
en, s'affirmer comme : Il s'est transformé en agneau, Il
s'affirme comme chef
Tout complément d'objet direct peut être accompagné
d'un attribut, qui peut être précédé d'une préposition
ou de comme, considéré alors comme une préposition
(voir D.2.I la forme comme) :
Je la crois intelligente
On l'appelle Marie
Elle me traite d'imbécile
Ils choisissent Marie comme chef
D.3.II. Listes des déterminants
Seront considérés comme déterminants
l'article
défini : le, la, les
indéfini : un, une, des, de (il
mange <GN>de bons fruits</GN>)
partitif : du, de la , de l', des
le déterminant possessif:
mon, ton, son, ma, ta, sa, mes, tes, ses,
notre, votre, leur, nos, vos, leurs
le déterminant démonstratif
formes simples : ce, cet, cette, ces,
formes renforcées : ci, là (<GN>cette maison-là</GN>)
le déterminant interrogatif et exclamatif
interrogatif : quel (<GN>quel jour</GN> <GN>ton mariage </GN>?),
quelle, combien de (<GN>combien de pommes</GN> veux-tu ?)
exclamatif : quel, quelle, que
(<GN>que de fois</GN> je vous
ai regretté)
le déterminant numéral
cardinal, il permet d'exprimer des nombres simples :
un, deux, trois ... dix, vingt, cent
(<GN>trois filles</GN>,<GN>les
trois filles</GN> )
ou des nombres plus complexes :
quatre vingt trois, deux cent douze,
vint et un, septante quatre... (<GN>vingt
cinq filles</GN>,<GN>les quatre vingt douze filles</GN>
de la classe)
premier, deuxième, troisième...(<GN> le premier homme </GN>)
le déterminant indéfini
marquant la quantité :
aucun, certain, chaque, maint, nul, plusieurs,
quelques, tout
Remarque :certains dans certains
des pays n'est pas un déterminant.
marquant certains aspects de l'identité :
tel, différents, divers,
determinants définis occasionnels : ce sont tous les adverbes de degré
suivis de des (pour bien) ou de de:
bien des, autant de, tant de, beaucoup de, tellement
de, énormément de, à peine de, suffisamment de...
Remarque : on laissera autre, même et quelconque dans la catégorie
des adjectifs indéfinis, car bien qu'ayant des ressemblances avec les
déterminants indéfinis, ils ne s'emploient pas sans déterminant.
certains mots considérés parfois comme des adjectifs indéfinis qui
précèdent un déterminant :
tous, toutes... (<GN>tous
les enfants</GN> jouent )
le déterminant relatif
lequel, laquelle, lesquels, lesquelles, auquel...
le syntagme formé par le déterminant relatif et le nom équivaut
à un pronom relatif :
dans un délai de trois jours ... <GN>lequel délai </GN>sera augmenté
d'un jour
D.3.III. Listes des prépositions composées
Nous avons extrait une liste des prépositions composées annotées dans
une partie de la référence. Cette liste ne prétend pas à
l'exhaustivité, puisqu'il s'agit de celles qui ont été observées dans
une partie du corpus, modulo un peu de généralisation. La règle de base
que nous avons suivie a été de ne considérer comme préposition composée
que les cas où la suite des mots n'est plus analysable si on les considère indépendamment.
afin de
à commencer par
à compter de
à fleur de
à même (dans "dormir à même le sol")
à moins de
à partir de
à savoir
à travers
à raison de
auprès de
au vu et au su de
en ce qui concerne
face à
faute de
grâce à
histoire de
le long de
lors de
quant à
quitte à
sans compter
sauf à
suite à
tout au long de
vis-à-vis de
En revanche, on ne considère pas comme une préposition composée les cas suivants :
des suites GN + NV + Prep :
<GN> compte </GN> <NV> tenu </NV> <GP> de ... </GP>,
<NV> étant </NV> <NV> donné </NV> <GN> quelque chose </GN>
des suites GP + Prep :
<GP> en matière </GP> <GP> de ... </GP>
<GP> dans l'attente </GP> <GP> de ... </GP>
<GP> à l'instar </GP> <GP> de ... </GP>
<GP> par le biais </GP> <GP> de ... </GP>
des suites GR + Prep :
<GR> contrairement </GR> <GP> à ... </GP>
<GR> conformément </GR> <GP> à ... </GP>
des suites GN + Prep :
<GN> ce fripon </GN> <GP> de valet </GP>
<GN> ma cochonnerie </GN> <GP> de voiture </GP>
D.3.IV. Listes des adverbes composés
Nous avons extrait une liste des adverbes composés annotés dans une
partie de la référence. Cette liste ne prétend pas à l'exhaustivité,
puisqu'il s'agit de ceux qui ont été observés dans une partie du
corpus, modulo un peu de généralisation. Il s'agit de formes lemmatisés
(donc les variantes sont à traiter à l'identique). La règle de base que
nous avons suivie a été de ne considérer comme adverbe composé que les cas où la suite des mots n'est plus analysable si on les considère indépendamment.
Des GR constitués (approximativement) comme des GN ou assimilés :
un peu
un petit peu
quelque peu
quelque fois
quelque part
nulle part
Des GR constitués (approximativement) comme des NV :
bien entendu
le cas échéant
autrement dit
y compris
peut-être
n'est-ce pas
à vrai dire
à verse
tant soit peu
un tant soit peu
qui plus est
coûte que coûte
vaille que vaille
soi disant
à tout va
Des formes complètement figées de la forme "tout à/de X" :
tout à fait
tout de même
tout de suite
tout à l'heure
tout d'abord
tout à coup
tout d'un coup
tout au plus
tout le temps
tout le long
tout du long
tout au moins
tout de go
Des formes complètement figées de la forme "X à X" :
peu à peu
petit à petit
tour à tour
pied à pied
mot à mot
Des formes complètement figées de la forme "X et/ou X" :
çà et là
bel et bien
de part et d'autre
peu ou prou
Des latinismes courants :
a priori
a posteriori
a fortiori
de facto
ipso facto
grosso modo
bis
ter
ex aequo
intra muros
extra muros
et caetera
urbi et orbi
Des comparatifs :
le moins
le plus
le mieux
de plus en plus
de moins en moins
de mieux en mieux
de pire en pire
de mal en pis
ni plus ni moins
d'autant moins
d'autant plus
Des GR qui devraient former un seul token :
là-dessus
là-dessous
ci-dessus
ci-dessous
là-dedans
ci-avant
ci-après
là-bas
ici-bas
ci-joint
d'abord
d'ailleurs
Des GR divers inanalysables :
quand même
du tout
pas du tout
de suite (si c'est bien dans le sens de "tout de suite")
de partout (si c'est bien dans le sens de "partout")
par contre
pour de bon
pour de vrai
pour de faux
d'ici peu
d'ici là
de plus belle
au jour le jour
de loin en loin
de fil en aiguille
ainsi de suite
bon an mal an
tel quel
mal à propos
à tout le moins
à qui mieux mieux
par ci par là
deçi delà
E. Annexe: exemples des différents formats
Nous présentons ici un exemple de phrase longue, qui illustre beaucoup des phénomènes précédents.
Annotation en constituants
Enoncé 5
GN 1
GP 2
NV 3
GP 4
GP 5
GN 6
GP 7
La
porte
de
la
chambre
fermée
à
clef
à
l'
intérieur
,
les
volets
de
l'
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
Enoncé 5
suite 7
NV 8
GN 9
GR 10
GP 11
GP 12
unique
fenêtre
fermés
,
eux
aussi
,
à
l'
intérieur
,
et
,
par-dessus
les
volets
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
Enoncé 5
GN 13
GA 14
GN 15
GP 16
NV 17
GR 18
NV 19
GN 20
,
les
barreaux
intacts
,
des
barreaux
à_travers
lesquels
vous
n'
auriez
pas
passé
le
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
Enoncé 5
suite 20
GN 21
GN 22
NV 23
GP 24
GR 25
GR 26
NV 27
bras
...
et
mademoiselle
qui
appelait
au
secours
!
...
ou
plutôt
non
,
on
ne
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
Enoncé 5
suite 27
GR 28
NV 29
GR 30
GA 31
NV 32
GR 33
GP 34
l'
entendait
plus
...
elle
était
peut-être
morte
...
mais
j'
entendais
encore
,
au
fond
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
Enoncé 5
GP 35
GN 36
GN 37
NV 38
PV 39
GN 40
NV 41
NV 42
GN 43
du
pavillon
,
monsieur
qui
essayait
d'
ébranler
la
porte
...
nous
avons
repris
notre
course
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
Enoncé 5
GN 44
GN 45
NV 46
NV 47
GP 48
,
la
concierge
et
moi
,
et
nous
sommes
revenus
au
pavillon
96
97
98
99
100
101
102
103
104
105
106
107
L'annotation des relations
Annotation des relations de dépendance (par type de relation)