O CINTIL-Treebank é um corpus de árvores sintácticas de constituência e de dependência,
composto maioritariamente por frases do CINTIL-Corpus Internacional do Português
anotadas com a respectiva árvore sintáctica. Este treebank está a ser desenvolvido
e mantido na Universidade de Lisboa
pelo NLX-Grupo de Fala e Linguagem Natural
do Departamento de Informática.
O CINTIL-Treebank encontra-se em construção e é composto por 35499 frases.
O treebank é composto por frases do corpus
Etiqueta | Categoria | Exemplos |
ADJ | Adjectivos | bom, brilhante, eficaz, … |
ADV | Advérbios | hoje, já, sim, felizmente, … |
CARD | Cardinais | zero, dez, cem, mil, … |
CJ | Conjunções | e, ou, tal como, … |
CL | Clíticos | o, lhe, se, … |
CN | Nomes comuns | computador, cidade, ideia, … |
DA | Artigos Definidos | o, os, … |
DEM | Demonstrativos | este, esses, aquele, … |
DFR | Denominadores de Fracções | meio, terço, décimo, %, … |
DGTR | Numerais Romanos | VI, LX, MMIII, MCMXCIX, … |
DGT | Numerais Árabes | 0, 1, 42, 12345, 67890, … |
DM | Marcadores Discursivos | olá, … |
EADR | Endereços Electrónicos | http://www.di.fc.ul.pt, … |
EOE | Fim de Enumeração | etc |
EXC | Exclamação | ah, ei, … |
GER | Gerúndios | sendo, afirmando, vivendo, … |
GERAUX | Gerúndio "ter"/"haver" em tempos compostos | tendo, havendo |
IA | Artigos Indefinidos | uns, umas, … |
IND | Indefinidos | tudo, alguém, ninguém, … |
INF | Infinitivo | ser, afirmar, viver, … |
INFAUX | Infinitivo "ter"/"haver" em tempos compostos | ter, haver, … |
INT | Interrogativos | quem, como, quando, … |
ITJ | Interjecções | bolas, caramba, … |
LTR | Letras | a, b, c, … |
MGT | Unidade de Medida | unidade, dezena, dúzia, resma, … |
MTH | Meses | Janeiro, Dezembro, … |
NP | Sintagmas Nominais | idem, … |
ORD | Ordinais | primeiro, centésimo, penúltimo, … |
PADR | Parte de Endereço | Rua, av., rot., … |
PNM | Parte de Nome | Lisboa, António, João, … |
PNT | Pontuação | ., ?, (, … |
POSS | Possessivos | meu, teu, seu, … |
PPA | Particípios passados que não formam tempos compostos | sido, afirmados, vivida, … |
PP | Sintagmas Preposicionais | algures, … |
PPT | Particípios passados em tempos compostos | sido, afirmado, vivido, … |
PREP | Preposições | de, para, em redor de, … |
PRS | Pronomes Pessoais | eu, tu, ele, … |
QNT | Quantificadores | todos, muitos, nenhum, … |
REL | Relativos | que, cujo, tal que, … |
STT | Títulos Sociais | Presidente, drª., prof., … |
SYB | Símbolos | @, #, &, … |
TERMN | Terminações Opcionais | (s), (as), … |
UM | "um" ou "uma" | um, uma |
UNIT | Unidade de Medida Abreviada | kg., km., … |
VAUX | Formas Finitas de "ter" ou "haver" em tempos compostos | temos, haveriam, … |
V | Verbos (sem ser PPA, PPT, INF ou GER) | falou, falaria, … |
WD | Dias da Semana | segunda, terça-feira, sábado, … |
Etiquetas para locuções |
LADV1…LADVn | Locuções Adverbiais | de facto, em suma, um pouco, … |
LCJ1…LCJn | Locuções Conjuncionais | assim como, já que, … |
LDEM1…LDEMn | Locuções Demonstrativas | o mesmo, … |
LDFR1…LDFRn | Locuções Denominadoras de Fracções | por cento |
LDM1…LDMn | Locuções Marcadoras Discursivas | pois não, até logo, … |
LITJ1…LITJn | Locuções Interjectivas | meu Deus |
LPRS1…LPRSn | Locuções Pronominais Pessoais | a gente, si mesmo, V. Exa., … |
LPREP1…LPREPn | Locuções Prepositivas | através de, a partir de, … |
LQD1…LQDn | Locuções Quantificadoras | uns quantos, … |
LREL1…LRELn | Locuções Pronominais Relativas | tal como, … |
Etiquetas específicas do corpus oral |
EMP | Enfático | |
EL | Extra-linguístico | |
PL | Para-linguístico | |
FRG | Fragmento | |