Eventos, 1º Colóquio de Linguística para o Processamento Automático de Linguagem Natural

Tamanho da fonte: 
Introdução à análise sintática automática do português
Leonel Figueiredo de Alencar

Prédio: Prédio ED VII
Sala: Sala 704
Data: 2012-11-29 10:30  – 12:00
Última alteração: 2012-10-31

Resumo


No âmbito das tecnologias da linguagem natural, a análise sintática automática (parsing) tem um amplo leque de aplicações, que vão da extração de informações à tradução automática, passando pela resolução de perguntas. Por outro lado, na linguística teórica e descritiva, a implementação computacional de uma gramática de uma língua permite verificar a sua consistência, adequação empírica e plausibilidade psicológica, por meio da aplicação de um parser a uma grande quantidade de textos. Neste minicurso, mostramos como desenvolver e testar parsers do português por meio do Aelius e do Donatus, que juntos constituem uma caixa de ferramentas para o parsing tanto raso quanto profundo e a anotação de corpora, combinando o processamento estatístico da linguagem natural com a abordagem baseada em regras. Implementados em Python e distribuídos sob uma licença livre, esses pacotes oferecem não só uma interface mais amigável para o NLTK (no qual estão sobretudo baseados) e outras bibliotecas, mas também várias outras facilidades, ao mesmo tempo em que contribuem para diminuir a carência de recursos livres para o processamento morfossintático computacional do português do Brasil.


Palavras-chave


Anotação; Corpus; Formalismos gramaticais; Sintaxe; Gramática Gerativa; Métodos Estatísticos;