Dicionario aberto: Um recurso para processamento de linguagem natural
Schlagworte:
dicionário aberto, dicionário electrónico, XML, XDXF, transcrição, anotaçãoAbstract
Este artigo apresenta o projecto Dicionário Aberto, a construção de um dicionário aberto, livre e gratuíto, para a língua portuguesa. Para ajudar no arranque optou-se pela transcrição de um dicionário em papel no domínimo público: Novo Diccionário da Língua Portuguesa, de Cândido de Figueiredo, de 1913.
Apresentamos o processo usado para a transcrição bem como a metodologia usada para garantir um patamar de qualidade mínima da transcrição, e como o dicionário foi posteriormente convertido para um formato XML, permitindo uma maior facilidade de processamento a terceiros
Finalmente, são discutidos os problemas existentes no uso de um dicionário com quase um século, e como se pretende proceder à sua modernização (de conteúdos e de grafia), e de que forma este recurso pode ser útil para o processamento da língua portuguesa