Carregando Eventos

« Todos Eventos

  • Este evento já passou.

Extração de Informação Pragmática em Documentos do Português do Brasil

14 - dezembro - 2017 | 09:00 - 12:00

O Programa de Pós-graduação em Ciência da Computação (PGCOMP) da Universidade Federal da Bahia convida a comunidade universitária para sua 18ª Defesa de Dissertação de Mestrado.

Mestrando:Cleiton Fernando Lima Sena

Banca: Profª Drª Daniela Barreiro Claro (Orientadora – UFBA)

Profª Drª Clarissa Castellã Xavier (UFBA)

Prof. Dr. Marlo Vieira dos Santos

Data:14/12/2017, Quinta-feira, às 09 horas

Local: Sala 12 do IME

 

Atualmente, há um aumento no volume de dados armazenados digitalmente. Considerando a Web, diariamente, um grande volume de dados, com conteúdos heterogêneos, é gerado. Muito destes dados estão disponíveis em linguagem natural. Nesse sentido, analisar, manualmente, tanta informação se torna uma tarefa lenta e inviável. Tendo em vista que a tarefa humana (manual) na análise de tais conteúdos é suscetível a erros, a EI (Extração de Informação) tem sido cada vez mais aplicada ao Processamento de Linguagem Natural (PLN). A Extração de Informação é dada pela atribuição de uma relação semântica entre um par (ou mais) de entidades, cujas relações são do tipo: “é um”, “foi para”, “nasceu em” etc. A EI pode ser estudada a partir de duas abordagens: Tradicional ou Aberto. A abordagem Tradicional, EI Tradicional, considera apenas um conjunto restrito de relações entre dois argumentos e identifica somente as relações equivalentes a este conjunto pré-estabelecido. Já a abordagem aberta, EI Aberta, permite extrair relações em uma grande quantidade de textos escritos em linguagem natural, cujos domínios são arbitrários. Considerando um contexto humano, uma troca de mensagens pode ser facilmente corrigida, quando não há uma compreensão entre as partes envolvidas. Já na extração automática de informações, os passos e mecanismos de extração devem estar bem definidos, garantindo que os significados passados sejam realmente compreendidos. Neste cenário, identificar relações semânticas, em um domínio aberto, é fundamental para extrair relações automaticamente. Contudo, a análise semântica não garante total precisão nas relações extraídas. Diferentes expressões/sentenças podem ter diversos significados, dependendo da sua intenção e de como são utilizadas. A análise pragmática se torna muito importante no processo de EI Aberta. Com este tipo de abordagem na EI Aberta é possível que se identifique o significado de determinada sentença de acordo com o contexto em que são utilizadas. Assim, o presente trabalho propôs um método de Extração de Informação Aberta para extrair relações de textos escritos em Português, considerando aspectos da Pragmática: inferência, contexto e intenção. Tais aspectos foram extraídos baseados em um conjunto de regras genéricas e específicas. Esta abordagem permitiu a extração de relações implícitas em textos e, consequentemente, aumentou-se a quantidade e a variedade das relações extraídas. Os resultados alcançados nesse trabalho confirmam que o método desenvolvido é superior na precisão, na quantidade e minimalidade dos fatos extraídos na maioria dos datasets avaliados, comparando com os três métodos mais relevantes do estado da arte.

Detalhes

Data:
14 - dezembro - 2017
Hora:
09:00 - 12:00