Dicionario aberto: Um recurso para processamento de linguagem natural

Autoras/es

  • Alberto Simões
  • Rita Farinha

Palabras clave:

dicionário aberto, dicionário electrónico, XML, XDXF, transcrição, anotação

Resumo

Este artigo apresenta o projecto Dicionário Aberto, a construção de um dicionário aberto, livre e gratuíto, para a língua portuguesa. Para ajudar no arranque optou-se pela transcrição de um dicionário em papel no domínimo público: Novo Diccionário da Língua Portuguesa, de Cândido de Figueiredo, de 1913.

Apresentamos o processo usado para a transcrição bem como a metodologia usada para garantir um patamar de qualidade mínima da transcrição, e como o dicionário foi posteriormente convertido para um formato XML, permitindo uma maior facilidade de processamento a terceiros

Finalmente, são discutidos os problemas existentes no uso de um dicionário com quase um século, e como se pretende proceder à sua modernização (de conteúdos e de grafia), e de que forma este recurso pode ser útil para o processamento da língua portuguesa

Descargas

Los datos de descargas todavía no están disponibles.

Descargas

Publicada

2020-04-21

Número

Sección

Instrumenta e formación