Processamento computacional de anáfora e correferência

Renata Vieira, Patrícia Nunes Gonçalves, José Guilherme C. de Souza

Abstract


A estrutura referencial é fundamental para a interpretação do discurso. Abordagens computacionais de interpretação da informação contida em bases textuais encontram nos processos anafóricos e correferenciais um grande desafio. Em trabalhos recentes da área, encontramos o emprego de técnicas sofisticadas para a descoberta de relações anafóricas. Tal pesquisa requer bases textuais em que relações correferenciais estejam identificadas de maneira acessível aos sistemas. A construção dessas bases se faz necessária para viabilizar a realização de pesquisas com a língua portuguesa. Estudos do problema mostram que a freqüência de retomada de um antecedente, baseada em conhecimento (semântico, lexical ou de mundo), é geralmente reduzida em relação ao total de tipos de usos. Apesar de menos freqüente, porém, esse tipo mais elaborado de retomada impõe sérias barreiras ao tratamento computacional do fenômeno. Os recursos disponíveis hoje, apesar de altamente sofisticados, são ainda insuficientes para tratar esse problema de forma satisfatória. No entanto, cada vez mais é reconhecida a importância do tratamento da correferência para outras tarefas de processamento de linguagem natural. Neste artigo analisamos especificamente o exemplo da sumarização automática.


Keywords


Relações anafóricas; Processamento da linguagem natural;Sumarização automática.

References


BICK, E. The Parsing System “PALAVRAS” - Automatic Grammatical Analysis of Portuguese in a Constraint Grammar Framework. 2000. Tese (Doutorado) – Department of Linguistics, University of Århus, DK., 2000.

CHAVES, A. R. A resolução de anáforas pronominais da língua portuguesa com base no algoritmo de Mitkov. 2007. Dissertação (Mestrado) – Universidade Federal de São Carlos, 2007.

COELHO, J. C. B. Uso de Informação de Correferência e Anáfora para Verificação da Coesão e Coerência Textual na Sumarização Automática. Junho 2007. Trabalho de Conclusão (Graduação em Letras) - Unisinos - São Leopoldo, 2007.

COELHO, J. C. B. et al. Resolving portuguese nominal anaphora. In: VIEIRA, R. et al. (Ed.). 7th Workshop on Computational Processing of Written and Spoken Language (PROPOR’2006). Itatiaia, RJ: Springer, 2006.

COELHO, T. T. Resolução de anáfora pronominal em português utilizando o algoritmo de Lappin e Leass. 2005. Dissertação (Mestrado) – Departamento de Computação, Universidade Estadual de Campinas - Unicamp, 2005.

COLLOVINI, S. Análise de Expressões Referenciais em Corpus Anotado da Língua Portuguesa. 2005. Dissertação (Mestrado) – Departamento de Computação, Universidade do Vale do Rio dos Sinos – Unisinos, 2005.

COLLOVINI, S. et al. Summit: Um corpus anotado com informações discursivas visando à sumarização automática. In: 5o Workshop em Tecnologia da Informação e da Linguagem Humana (TIL’2007). Rio de Janeiro, RJ: Proceedings of the SBC, 2007.

COLLOVINI, S.; VIEIRA, R. Anáforas nominais definidas: balanceamento de corpus e classificação. In: IV Workshop de Tecnologia da Informação e Linguagem Humana TIL. Ribeirão Preto, SP: Proceeding of the Brazilian Symposium on Artificial Intelligence, 2006a.

COLLOVINI, S.; VIEIRA, R. Análise de expressões referenciais em corpus anotado da língua portuguesa. In: V Best MSc dissertation/PhD thesis contest (CTDIA’2006). Ribeirão Preto, SP: Proceedings of the SBIA-IBERAMIA, 2006b.

FELLBAUM, C. WordNet: An Electronical Lexical Database. Cambridge, MA: The MIT Press, 1998.

FISHER, D. et al. Description of the umass system as used for muc-6. In: MUC6 ’95: Proceedings of the 6th conference on Message understanding. Morristown, NJ, USA: Association for Computational Linguistics, 1995. p. 127-140.

GONÇALVES, P. N. Aplicando Cadeias de Correferência na revisão de Sumários Extrativos. Dissertação (Mestrado) – Departamento de Computação, Universidade do Vale do Rio dos Sinos – Unisinos, 2008 (em preparação).

HICKMAN, M. Creating referents in discourse: a developmental analysis of linguistic cohesion. In: OJEDA, J.; KREIMAN, A. E. (Ed.). Papers form the parasession on pronouns and anaphora. Chicago: Linguistic Society, 1980. p. 192-203.

JURAFSKY, D.; MARTIN, J. Speech and language processing. Englewood Cliffs, NJ: Alan Apt, 2000. Cap. Discourse, p. 670-718.

KOCH, I. G. V. Desvendando os Segredos do texto. São Paulo: Cortez, 2003.

KOCH, I. G. V.; TRAVAGLIA, L. C. A coesão textual. São Paulo: Contexto, 1996.

LAPPIN, S.; LEASS, H. An algorithm for pronominal anaphora resolution. Computational Linguistics, v. 20, n. 4, p. 535-561, 1994.

MCCARTHY, J. F. A trainable approach to coreference resolution for information extraction. 1996. Tese (Doutorado) – Director-Wendy G. Lehnert, 1996.

MCCARTHY, J. F.; LEHNERT, W. G. Using decision trees for coreference resolution. In: IJCAI, 14th. 1995. Montreal, Canada: Proceedings…, Montreal, 1995. p. 1050-1055.

MITKOV, R. Anaphora Resolution. [S.l.]: Longman, 2002.

MÜLLER, C.; STRUBE, M. Mmax: A tool for the annotation of multimodal corpora. In: IJCAI Workshop on Knowledge and Reasoning in Practical Dialogue Systems, 2nd, 2001. Seattle, Washington. Proceedings…, 2001. p. 45-50.

PARDO, T. GistSumm - GIST SUMMarizer: Extensões e Novas Funcionalidades. São Carlos, SP, 2005.

PERINI, M. A. Gramática descritiva do português. São Paulo: Ática, 1995. 308 p.

PONZETTO, S. P.; STRUBE, M. Exploiting semantic role labeling, wordnet and wikipedia for coreference resolution. In: Human Language Technology Conference of the NAACL, Main Conference. 2006. New York City, USA: Association for Computational Linguistics. Proceedings... 2006. p. 192-199. Disponível em: http://www.aclweb.org/anthology/N/N06/N06-1025.

RIBEIRO Jr, L. C. et al. Uso de informações semânticas na identificação de anáforas indiretas e associativas. In: Workshop em Tecnologia da Informação e da Linguagem Humana (TIL’2007), 5o. Rio de Janeiro, RJ: Proceedings of the SBC..., 2007.

ROTH, F. P.; SPEKMAN, N. J.; FYE, E. C. Reference cohesion in the oral narratives of students with learning disabilities and normally achieving students. In: Learning Disability Quarterly, v. 18, n. 1, p. 25-40, 1995.

SOON, W. M.; NG, H. T.; LIM, D. C. Y. A machine learning approach to coreference resolution of noun phrases. Computacional Linguistic, v. 27, n. 4, p. 521-544, 2001. Disponível em: http://www.aclweb.org/anthology/J01-4004.pdf.

SOUZA, J. G. C. de. Resolução automática de correferência aplicada à língua portuguesa. Nov. 2007. Trabalho de conclusão.

VIEIRA, R. Definite description processing in unrestricted text. 1998. Tese (Doutorado) – University of Edinburgh, Edinburgh, 1998.

VIEIRA, R.; POESIO, M. An empirically-based system for processing definite descriptions. Computational Linguistics, v. 26, n. 4, p. 539-594, 2000.




DOI: http://dx.doi.org/10.17851/2237-2083.16.1.263-284

Refbacks

  • There are currently no refbacks.
';



Copyright (c)



e - ISSN 2237-2083 

License

Licensed through  Creative Commons Atribuição 4.0 Internacional