Dicionario aberto: Um recurso para processamento de linguagem natural

Autores

  • Alberto Simões
  • Rita Farinha

Palavras-chave:

dicionário aberto, dicionário electrónico, XML, XDXF, transcrição, anotação

Resumo

Este artigo apresenta o projecto Dicionário Aberto, a construção de um dicionário aberto, livre e gratuíto, para a língua portuguesa. Para ajudar no arranque optou-se pela transcrição de um dicionário em papel no domínimo público: Novo Diccionário da Língua Portuguesa, de Cândido de Figueiredo, de 1913.

Apresentamos o processo usado para a transcrição bem como a metodologia usada para garantir um patamar de qualidade mínima da transcrição, e como o dicionário foi posteriormente convertido para um formato XML, permitindo uma maior facilidade de processamento a terceiros

Finalmente, são discutidos os problemas existentes no uso de um dicionário com quase um século, e como se pretende proceder à sua modernização (de conteúdos e de grafia), e de que forma este recurso pode ser útil para o processamento da língua portuguesa

Downloads

Não há dados estatísticos.

Downloads

Publicado

2020-04-21

Edição

Secção

Instrumenta e formación