O LX-DepParser (versão beta) é um serviço online gratuito para a análise sintáctica de frases do Português. Este serviço permite a análise sintáctica automática de frases do português em termos das suas funções gramaticais.
Foram utilizadas 22.118 frases no treino do parser, contendo 250.056 ocorrências de palavras.
As frases têm origem no CINTIL-Treebank.
Este recurso está a ser desenvolvido e mantido na Universidade de Lisboa
pelo
NLX-Grupo de Fala e Linguagem Natural
do Departamento de Informática.
No que toca à avaliação do LX-DepParser,
o seu UAS (unlabeled attachment score) é de 94.42 e o seu LAS (labeled attachment score) é de 91.23.
Etiqueta | Categoria | Exemplos |
ADJ | Adjectivos | bom, brilhante, eficaz, … |
ADV | Advérbios | hoje, já, sim, felizmente, … |
CARD | Cardinais | zero, dez, cem, mil, … |
CJ | Conjunç ões | e, ou, tal como, … |
CL | Clíticos | o, lhe, se, … |
CN | Nomes comuns | computador, cidade, ideia, … |
DA | Artigos Definidos | o, os, … |
DEM | Demonstrativos | este, esses, aquele, … |
DFR | Denominadores de Fracções | meio, terço, décimo, %, … |
DGTR | Numerais Romanos | VI, LX, MMIII, MCMXCIX, … |
DGT | Numerais árabes | 0, 1, 42, 12345, 67890, … |
DM | Marcadores Discursivos | olá, … |
EADR | Endereços Electrónicos | http://www.di.fc.ul.pt, … |
EOE | Fim de Enumeração | etc |
EXC | Exclamaç ão | ah, ei, … |
GER | Gerúndios | sendo, afirmando, vivendo, … |
GERAUX | Gerúndio "ter"/"haver" em tempos compostos | tendo, havendo |
IA | Artigos Indefinidos | uns, umas, … |
IND | Indefinidos | tudo, alguém, ninguém, … |
INF | Infinitivo | ser, afirmar, viver, … |
INFAUX | Infinitivo "ter"/"haver" em tempos compostos | ter, haver, … |
INT | Interrogativos | quem, como, quando, … |
ITJ | Interjecções | bolas, caramba, … |
LTR | Letras | a, b, c, … |
MGT | Unidade de Medida | unidade, dezena, dúzia, resma, … |
MTH | Meses | Janeiro, Dezembro, … |
NP | Sintagmas Nominais | idem, … |
ORD | Ordinais | primeiro, centésimo, penúltimo, … |
PADR | Parte de Endereço | Rua, av., rot., … |
PNM | Parte de Nome | Lisboa, António, João, … |
PNT | Pontuação | ., ?, (, … |
POSS | Possessivos | meu, teu, seu, … |
PPA | Particípios passados que não formam tempos compostos | sido, afirmados, vivida, … |
PP | Sintagmas Preposicionais | algures, … |
PPT | Particípios passados em tempos compostos | sido, afirmado, vivido, … |
PREP | Preposições | de, para, em redor de, … |
PRS | Pronomes Pessoais | eu, tu, ele, … |
QNT | Quantificadores | todos, muitos, nenhum, … |
REL | Relativos | que, cujo, tal que, … |
STT | Títulos Sociais | Presidente, drª., prof., … |
SYB | Símbolos | @, #, &, … |
TERMN | Terminações Opcionais | (s), (as), … |
UM | "um" ou "uma" | um, uma |
UNIT | Unidade de Medida Abreviada | kg., km., … |
VAUX | Formas Finitas de "ter" ou "haver" em tempos compostos | temos, haveriam, … |
V | Verbos (sem ser PPA, PPT, INF ou GER) | falou, falaria, … |
WD | Dias da Semana | segunda, terça-feira, sábado, … |
Etiquetas para locuções |
LADV1…LADVn | Locuções Adverbiais | de facto, em suma, um pouco, … |
LCJ1…LCJn | Locuções Conjuncionais | assim como, já que, … |
LDEM1…LDEMn | Locuções Demonstrativas | o mesmo, … |
LDFR1…LDFRn | Locuções Denominadoras de Fracções | por cento |
LDM1…LDMn | Locuções Marcadoras Discursivas | pois não, até logo, … |
LITJ1…LITJn | Locuções Interjectivas | meu Deus |
LPRS1…LPRSn | Locuções Pronominais Pessoais | a gente, si mesmo, V. Exa., … |
LPREP1…LPREPn | Locuções Prepositivas | através de, a partir de, … |
LQD1…LQDn | Locuções Quantificadoras | uns quantos, … |
LREL1…LRELn | Locuções Pronominais Relativas | tal como, … |
Etiquetas específicas do corpus oral |
EMP | Enfático | |
EL | Extra-linguístico | |
PL | Para-linguístico | |
FRG | Fragmento | |
As análises produzidas pelo LX-DepParser são semelhantes às representações de
dependência
presentes no treebank de dependências sobre o qual o LX-DepParser foi treinado.
Este treebank de dependências foi anotado de acordo com os princípios descritos no seguinte manual:
Pode contactar-nos para o seguinte endereço de correio electrónico:
'nlx' seguido de '@'
seguido de 'di.fc.ul.pt'.
O LX-DepParser foi parcialmente financiado pela
FCT-Fundação para a Ciência e a Tecnologia, no âmbito do contrato
FCT/PTDC/PLP/81157/2006 para o projecto
SemanticShare.