LX-Lemmatizer

Desenvolvido na Universidade de Lisboa, Departamento de Informática, pelo NLX-Grupo de Fala e Linguagem Natural.


características    |    english version

 

 

Características


Índice

LX-Lem

O LX-Lem (versão beta) é um serviço online gratuito para a lematização exaustiva de verbos portugueses. Foi desenvolvido e é mantido pelo NLX-Grupo de Fala e Linguagem Natural da Universidade de Lisboa, Departamento de Informática.

Talvez seja também do seu interesse experimentar o LX-Suite, um serviço online de processamento superficial do português.

Características

O LX-Lem toma uma forma verbal e apresenta os lemas correspondentes (infinitivos) juntamente com os valores para os traços de flexão.

à data do início de funcionamento (Novembro de 2005), é o primeiro serviço online gratuito para a lematização verbal do português em todos os seus pormenores. Inclui:

 

Para além disto, o LX-Lem lida exaustivamente com um conjunto de casos que tendem a não ser contemplados na sua totalidade pelos conjugadores verbais:

 

O LX-Lem suporta tanto verbos conhecidos como desconhecidos. Assim, lematiza:

 

Vale também a pena mencionar os seguintes princípios de design, que o LX-Lem adopta para os chamados verbos defectivos:

 

O LX-Lem lida com os poucos casos em que pode haver formas diferentes em diferentes variantes da língua portuguesa:

 

Com o objectivo de optimizar a usabilidade, o LX-Lem adopta o seguinte esquema quanto à posição dos clíticos:

Autoria

O LX-Lem está a ser desenvolvido por António Branco e Filipe Nunes, com a ajuda de Francisco Costa, do NLX-Grupo de Fala e Linguagem Natural, da Universidade de Lisboa, Departamento de Informática.

Agradecimentos

O trabalho conducente ao LX-Lem foi apoiada em parte pela FCT-Fundação para a Ciência e Tecnologia através do contrato POSI/PLP/47058/2002 relativo ao projecto TagShare.

Publicações

Branco, António, Filipe Nunes and João Silva, 2006, Verb Analysis in an Inflective Language: Simpler is better, Internal report, University of Lisbon, Department of Informatics.

Branco, António, Francisco Costa and Filipe Nunes, 2006, Processing of Verb Inflectional Ambiguity: Towards a Problem Space Delimitation, Internal report, University of Lisbon, Department of Informatics.

Contacto

Para contacto, usar o endereço de e-mail: 'nlxgroup' concatenado com '@' concatenado com 'di.fc.ul.pt'.

Porquê o LX-Lem?

LX porque Lx é o diminutivo que os lisboetas gostam de usar para se referir à sua cidade.