Eventos, 1º Colóquio de Linguística para o Processamento Automático de Linguagem Natural

Tamanho da fonte: 
Aquisição Automática de Conhecimento
Christian Aranha

Prédio: Prédio ED III
Sala: Auditório Manoel Vereza de Oliveira
Data: 2012-11-30 02:30  – 03:00
Última alteração: 2012-10-31

Resumo


A Web 3.0 ainda não aconteceu, a promessa é que ela seja uma Web mais Semântica. Uma Internet que liga não apenas documentos, mas também informação. Uma nova camada pousará sobre a Internet atual reconhecendo coisas e entidades e enriquecendo-as com metadados. Estes metadados auxiliarão aos computadores trocarem melhor a informação entre si, provendo melhores serviços aos usuários.

Algumas especificações já estão ganhando espaço, como microformatos, RDF e OWL. Mais ainda são muito sofisticadas para os humanos disseminarem conteúdos enriquecidos pela Web. A proposta aqui é mostrar um nível de inteligência artificial que poderá manipular ontologias do conhecimento para enriquecer automaticamente os conteúdos da Web atual.

Enriquecer um documento texto nada mais é do que adicionar metadados semânticos às palavras do texto de modo que o computador possa classificar e inserir as entidades em uma base de conhecimento organizada para futuras consultas. A classificação no nível da entidade demanda uma profundidade maior de pesquisa no universo da lingüística. É necessário analisar sintaticamente as frases para desambiguar a semântica das entidades. Esta é a grande diferença entre o campo do PLN e o campo da Mineração de Textos. PLN é dependente de língua e por isso requer recursos lingüísticos, já mineração de textos pode ser bem mais estatístico e extrair informação de um volume de textos.