Features


Table of contents

LX-NER

LX-NER is a freely available online service for the recognition of expressions for named entities in Portuguese. It was developed and is maintained by the NLX-Natural Language and Speech Group at the University of Lisbon, Department of Informatics.

You may be also interested to use our LX-Suite online service for the shallow processing of Portuguese.

Features

LX-NER takes a segment of Portuguese text and identifies, circumscribes and classifies the expressions for named entities it contains. Furthermore, each named entity receives a standard representation. It handles the following types of expressions:

Evaluation

Authorship

LX-NER is being developed by João Balsa, António Branco, Eduardo Ferreira and Sara Silveira, with the help of João Silva, of the NLX-Natural Language and Speech Group, at the University of Lisbon, Department of Informatics.

Acknowledgments

The work leading to the LX-NER was partly supported by FCT-Fundação para a Ciência e Tecnologia under the contract POSI/PLP/47058/2002 for the project TagShare and the contract POSI/PLP/61490/2004 for the project QueXting, and the European Commission under the contract FP6/STREP/27391 for the project LT4eL.

White Papers

Florbela Barreto, António Branco, Eduardo Ferreira, Amália Mendes, Maria Fernanda Bacelar do Nascimento, Filipe Nunes and João Silva, 2006. Open Resources and Tools for the Shallow Processing of Portuguese: The TagShare Project. In Proceedings of the 5th International Conference on Language Resources and Evaluation (LREC'06).

Florbela Barreto, António Branco, Eduardo Ferreira, Amália Mendes, Maria Fernanda Bacelar do Nascimento, Filipe Nunes and João Silva, 2006. Linguistic Resources and Software for Shallow Processing. In Actas do XXI Encontro da Associação Portuguesa de Linguística (APL'05).

Contact Us

Contact us using the following e-mail address: 'nlxgroup' concatenated with 'at' concatenated with 'di.fc.ul.pt'.

Why LX-NER?

LX because LX is the "code" name Lisboners like to use to refer to their hometown.

Number-based Named Entities

Encoding

 Color   Expression of …   Examples 
 Brown   numbers  "… quarenta e sete centésimos …"

<EN>
    <VERBATIM>
         <EN>
             <VERBATIM>quarenta e sete</VERBATIM>
             <OPT ID='1'>
                 <NUMEX>
                     <TYPE>Cardinal</TYPE>
                     <VALUE>+47</VALUE>
                 </NUMEX>
             </OPT>
         </EN>
          centésimos
    </VERBATIM>
    <OPT ID='1'>
         <NUMEX>
             <TYPE>Fraction</TYPE>
             <VALUE>+47 / +100</VALUE>
         </NUMEX>
    </OPT>
</EN>
 Blue   measures  "… 1.268.251,64 euros …"

<EN>
    <VERBATIM>
         <EN>
             <VERBATIM>1.268.251,64</VERBATIM>
             <OPT ID='1'>
                 <NUMEX>
                     <TYPE>Decimal</TYPE>
                     <VALUE>+1,268,251.64</VALUE>
                 </NUMEX>
             </OPT>
         </EN>
          euros
    </VERBATIM>
    <OPT ID='1'>
         <MEASEX>
             <TYPE>Currency</TYPE>
             <VALUE>+1,268,251.64 EUR</VALUE>
         </MEASEX>
    </OPT>
</EN>
 Green   time  "… 8 de Novembro de 2006 …"

<EN>
    <VERBATIM>
         <EN>
             <VERBATIM>8</VERBATIM>
             <OPT ID='1'>
                 <NUMEX>
                     <TYPE>Arabic</TYPE>
                     <VALUE>+8</VALUE>
                 </NUMEX>
             </OPT>
         </EN>
           de Novembro de
         <EN>
             <VERBATIM>2006</VERBATIM>
             <OPT ID='1'>
                 <NUMEX>
                     <TYPE>Arabic</TYPE>
                     <VALUE>+2,006</VALUE>
                 </NUMEX>
             </OPT>
         </EN>
    </VERBATIM>
    <OPT ID='1'>
         <TIMEX>
             <TYPE>Date</TYPE>
             <YEAR>2006</YEAR>
             <MONTH>November</MONTH>
             <DAY>08</DAY>
         </TIMEX>
    </OPT>
</EN>
 Red   addresses  "… Avenida D. João IV, Nº 27 - Fogueteiro, 1234-567 Amora …"

<EN>
    <VERBATIM>
         Avenida D. João
         <EN>
             <VERBATIM>IV</VERBATIM>
             <OPT ID='1'>
                 <NUMEX>
                     <TYPE>Roman</TYPE>
                     <VALUE>+4</VALUE>
                 </NUMEX>
             </OPT>
         </EN>
          , Nº
         <EN>
             <VERBATIM>27</VERBATIM>
             <OPT ID='1'>
                 <NUMEX>
                     <TYPE>Arabic</TYPE>
                     <VALUE>+27</VALUE>
                 </NUMEX>
             </OPT>
         </EN>
           - Fogueteiro,
         <EN>
             <VERBATIM>1234</VERBATIM>
             <OPT ID='1'>
                 <NUMEX>
                     <TYPE>Arabic</TYPE>
                     <VALUE>+1234</VALUE>
                 </NUMEX>
             </OPT>
         </EN>
           -
         <EN>
             <VERBATIM>567</VERBATIM>
             <OPT ID='1'>
                 <NUMEX>
                     <TYPE>Arabic</TYPE>
                     <VALUE>+567</VALUE>
                 </NUMEX>
             </OPT>
         </EN>
          Amora
    </VERBATIM>
    <OPT ID='1'>
         <ADDREX>
             <GLOBAL>Avenida D. João IV</GLOBAL>
             <LOCAL>Nº 27 - Fogueteiro</LOCAL>
             <ZIPCODE>1234-567 Amora</ZIPCODE>
         </ADDREX>
    </OPT>
</EN>

Examples

 Color   Expression of …   Subtypes  Examples
 Brown   numbers   Arabic  25765912
+25.245.674.493
-4.653.926
 Decimal  25765912,43
+25.245.674,128
-4.926,494
 Non-compliant  125.25.125.25
+54,493.74
-4,553,228.123
 Roman  XXV
MCMXCIX
MMMDCCCLXXXVIII
 Cardinal  sete mil quatrocentos e cinquenta e oito
duzentos e noventa e três milhões, cento e cinquenta mil e vinte e dois
148,4 biliões
 Fraction  +414 / -582,27
89%
583 décimas milésimas
quarenta e nove quadringentésimos
dois milhões, oitocentas e uma décimas
setenta por cento
vinte e três cinquenta e quatro avos
 Magnitude class  53 resmas
385,3 lustros
oitenta e sete mil lustros
zero quarteirões
5 dezenas de milhares de milhões e 3 milhares de milhões
cinco milhares, sete centenas, uma dezena e duas unidades
46 milhões, 134 milhares e 34 unidades
 Blue   measures   Currency  5.832 euros
138,47 libras
1999 lekë
 Time  27 horas
oito anos
4,7 milénios
 Scientific units  28 km
trinta e quatro hectares
5 litros
 Green   time   Date  2 de Novembro de 2006
07/05/1981
25-08-2001
 Time periods  ano de 2006
década de oitenta
século XXI
 Time of the day  meia-noite e um quarto
às 13h30m
por volta das dezoito e cinquenta e dois
 Red   addresses   N/A  Rua 1º de Maio
Pr. Eça de Queirós, Nº 8 Paivas, 6666 Amora
Rua Almeida Garrett, Lote 3 - 4º Dto Fogueteiro, 9999-666 Seixal

Encoding

 Color   Expression of …   Examples 
 Brown   persons  "… Professor João Ricardo Lopes da Silva …"

<EN>
    <VERBATIM>
         Professor João Ricardo Lopes da Silva
    </VERBATIM>
    <OPT ID='1'>
         <NAMEX>
             <TYPE>Person</TYPE>
             <VALUE>
                 Professor João Ricardo Lopes da Silva
             </VALUE>
         </NAMEX>
    </OPT>
</EN>
 Blue   organizations  "… Portugal Telecom …"

<EN>
    <VERBATIM>
         Portugal Telecom
    </VERBATIM>
    <OPT ID='1'>
         <NAMEX>
             <TYPE>Organization</TYPE>
             <VALUE>
                 Portugal Telecom
             </VALUE>
         </NAMEX>
    </OPT>
</EN>
 Green   locations  "… Deserto do Sahara …"

<EN>
    <VERBATIM>
         Deserto do Sahara
    </VERBATIM>
    <OPT ID='1'>
         <NAMEX>
             <TYPE>Localization</TYPE>
             <VALUE>
                 Deserto do Sahara
             </VALUE>
         </NAMEX>
    </OPT>
</EN>
 Red   events  "… Festa da Música …"

<EN>
    <VERBATIM>
         Festa da Música
    </VERBATIM>
    <OPT ID='1'>
         <NAMEX>
             <TYPE>Event</TYPE>
             <VALUE>
                 Festa da Música
             </VALUE>
         </NAMEX>
    </OPT>
</EN>
 Purple   works  "… Massacre no Texas …"

<EN>
    <VERBATIM>
         Massacre no Texas
    </VERBATIM>
    <OPT ID='1'>
         <NAMEX>
             <TYPE>Work</TYPE>
             <VALUE>
                 Massacre no Texas
             </VALUE>
         </NAMEX>
    </OPT>
</EN>
 Orchid   miscellaneous  "… Stradivarius …"

<EN>
    <VERBATIM>
         Stradivarius
    </VERBATIM>
    <OPT ID='1'>
         <NAMEX>
             <TYPE>Miscellaneous</TYPE>
             <VALUE>
                 Stradivarius
             </VALUE>
         </NAMEX>
    </OPT>
</EN>

Examples

 Color   Expression of …  Examples
 Brown   persons  João Silva
Georgios Samaras
Doutor Gustavo Lopes da Silva
Sua Excelência o Professor Francisco Costa
Eng. Pedro Martins
 Blue   organizations  Feira Internacional de Lisboa
Fundação Calouste Gulbenkian
Ministério das Finanças
Associação Nacional de Professores de Informática
Apple Computer
 Green   locations  Norte de Portugal
Alentejo
Reguengos de Monsaraz
Centro Comercial Colombo
Parque das Nações
 Red   events  Feira Internacional do Artesanato 2006
Festival Internacional de Cinema de Cannes
IV Encontro Nacional de Marcadores Moleculares
V Congresso Ibero-Americano de Educação Ambiental
Macworld 2006
 Purple   works  O Padrinho
Gangs de Nova Iorque
Romeu e Julieta
Metamorfose de Narciso
Moon-Woman Cuts the Circle
 Orchid   miscellaneous  Zeus
Natureza
Matemática
Física
Macbook Pro