O papel da pausa na segmentação prosódica de corpora de fala

Tommaso Raso, Maryualê Malvessi Mittmann, Anna Carolina Oliveira Mendes


Resumo: O trabalho apresenta uma análise da pausa silenciosa enquanto critério de segmentação da fala em unidades comunicativamente autônomas. O objetivo deste trabalho é contextualizado com uma discussão sobre a unidade de referência da fala e a noção de pausa. Argumenta-se a favor de uma segmentação da fala em unidades pragmáticas de natureza acional, delimitadas no fluxo da fala por meio de fronteiras prosódicas. Realizou-se análise estatística em amostra aleatória de fala espontânea extraída do corpus C-ORALBRASIL. Por intermédio de um modelo de regressão não linear, procurou-se identificar durações de pausas consistentemente preditivas de fronteiras de unidades de referência. Os resultados mostram que não há nenhum valor de duração de pausa que possa ser utilizado como critério confiável para a segmentação da fala em unidades comunicativamente autônomas.

Palavras chave: fala; corpora; segmentação; unidade prosódica; ilocução.

Abstract: This work presents an analysis of silent pauses when applied as criterion for the segmentation of speech into communicatively autonomous units. The aim of this work is contextualized in a discussion about the unit of reference for speech and the notion of pause. We argue that speech should be parsed into pragmatic units of actional nature, which are signaled within the speech flow by prosodic boundaries. We performed a statistic analysis on a random spontaneous speech sample extracted from C-ORAL-BRASIL corpus. Non-linear regression models were applied so as to identify pause durations that could consistently predict unit boundaries. Results show that there isn’t any pause duration value that could be used as a reliable criterion for the segmentation of speech into communicatively autonomous units.

Keywords: Speech; Corpora; Segmentation; Prosodic Unit; Illocution.


Speech; Corpora; Segmentation; Prosodic Unit; Illocution.


ALBANO LEONI, F.; MATURI, P. Manuale di fonetica. Roma: Carocci, 2002.

AUSTIN, J. How to do things with words. London: Oxford University Press, 1962.

BARBOSA, P. A. Incursões em torno do ritmo da fala. São Paulo: Pontes, 2006. (Fapesp).

BERRUTO, G. Varietà diamesiche, diastratiche, diafasiche. In: A SOBRERO, A (Org.). Introduzione all’italiano contemporaneo: La variazione e gli usi. Roma: Laterza, 1993. p. 37-92.

BIBER, D. et al. The Longman grammar of spoken and written English. London: Longman, 1999.

BOERSMA, P.; WEENINK, D. Praat: doing phonetics by computer. 2014. Programa de computador, versão 5.4.19. Disponível em: http://www.praat.org/. Acesso em: 16 set. 2015.

BUHMANN, Jeska et al. Annotation of prominent words, prosodic boundaries and segmental lengthening by non-expert transcribers in the Spoken Dutch Corpus. In: INTERNATIONAL CONFERENCE ON LANGUAGE RESOURCES AND EVALUATION, 3, 2002, Las Palmas. Proceedings... Las Palmas: Elra, Universidad de Las Palmas de Gran Canaria, 2002. p. 1 - 7. Disponível em: http://www.lrec-conf.org/proceedings/lrec2002/pdf/96.pdf. Acesso em: 20 set. 2015.

CARLSON, R.; HIRSCHBERG, J.; SWERTS, M. Cues to upcoming Swedish prosodic boundaries: Subjective judgment studies and acoustic correlates. Speech Communication, Nara, v. 46, n. 3-4, p. 326-333, jul. 2005. Elsevier BV. Disponível em: http://api.elsevier.com/content/article/PII:S0167639305000932?httpAccept=text/xml. Acesso em: 22 set. 2015. DOI: http://dx.doi.org/10.1016/j.specom.2005.02.013

CAVALCANTE, F.; RAMOS, A. Um minicorpus de inglês americano etiquetado informacionalmente, em preparação.

CHOMSKY, N. Remarks on nominalization. In: JACOBS, R.; ROSENBAUM, P. (Org.) Reading in English Transformational Grammar. Waltham: Ginn, 1970. p. 184-221.

CRESTI, E. Corpus di Italiano parlato. v. 1. Firenze: Accademia della Crusca, 2000.

CRESTI, E., La Stanza: un’unità di costruzione testuale del parlato. In: CONGRESSO DELLA SOCIETÀ INTERNAZIONALE DI LINGUISTICA E FILOLOGIA ITALIANA, 10, 2008, Basilea. Atti… Org.: A. Ferrari. Firenze: Cesati, 2010. p. 713 - 732.

CRESTI, E. Syntactic properties of spontaneous speech in the Language into Act Theory. In: RASO, T.; MELLO, H. Spoken Corpora and Linguistic Studies. Amsterdam/Philadelphia: John Benjamins, 2014. p. 365-410.

DOI: http://dx.doi.org/10.1075/scl.61.13cre

CRESTI, E.; GRAMIGNI, P. Per una linguistica corpus based dell’italiano parlato: Le unità di riferimento. In: CONVEGNO NAZIONALE “IL PARLATO ITALIANO", Napoli. Atti… Ed.: F. Albano Leoni, et al. Napoli: D’Auria, CD-ROM, 2004. p. 1–26.

CRESTI, E.; MONEGLIA, M. (Orgs.). C-ORAL-ROM: Integrated reference corpora for spoken Romance Languages. Amsterdam/Philadelphia: John Benjamins, 2005. DOI: http://dx.doi.org/10.1075/scl.15

CRYSTAL, D. The English tone of voice. London: Edward Arnold, 1975.

DU BOIS, J. et al. Santa Barbara Corpus of Spoken American English, Parts 1-4. Philadelphia, PA: Linguistic Data Consortium, 2000–2005.

FLEISS, J. L. Measuring nominal scale agreement among many raters. Psychological Bulletin, v. 76, p. 378-382, 1971. DOI: http://dx.doi.org/10.1037/h0031619

HARRIS, Z. S. String analysis of sentence structure. The Hague: Mouton, 1962.

HARRIS, M.; UMEDA, N; BOURNE, J. Boundary perception in fluent speech. Journal of Phonetics, n. 9, p. 1-18, 1981.

IZRE'EL, S.; HARY, B.; RAHAV, G. Designing CoSIH: The Corpus of Spoken Israeli Hebrew. International Journal of Corpus Linguistics, n. 6, p. 171-197, 2001.

MARTIN, Philippe. Winpitch Pro W8. v 7.2.00. Pitch Instruments. Disponível em: http://www.winpitch.com/, 2015. Acesso em: 25 set. 2015.

MARUYAMA, T. Speech segmentation by clausal and non-clausal boundaries in Japanese. INTERNATIONAL CONFERENCE ON COGNITIVE SCIENCE, 5, Kaliningrad. Abstracts… V. 2: Workshop Spoken discourse corpora as a window on cognitive mechanisms of speech production. Kaliningrad, June 2012. p. 787-783

MARUYAMA, T. Two-Level Utterance Units: Cognitive and Communicative Aspects of Spontaneous Speech. LABLITA, 9; LEEL, 4, INTERNATIONAL WORKSHOP, Belo Horizonte, 2015. Conferências… Units of Reference for Spontaneous Speech Analysis and their correlations across languages, Belo Horizonte, August 6, 2015.

MELLO, H. R., Methodological issues for spontaneous speech corpora compilation: The case of C-ORAL-BRASIL. In: RASO, T.; MELLO, H. R. Spoken Corpora and Linguistic Studies. Amsterdam/Philadelphia: John Benjamins, 2014. p. 27-68. DOI: http://dx.doi.org/10.1075/scl.61.01mel.

MELLO, H. R. et al. Transcrição e segmentação prosódica do corpus C-ORAL-BRASIL: critérios de implementação e validação. In: RASO, T.; MELLO, H. R. (Ed.) C-ORAL – Brasil I: Corpus de referência do português brasileiro falado informal. Belo Horizonte: Editora UFMG, 2012. p. 125-176.

MELLO, H.; RASO, T.; BOSSAGLIA, G.; SANTANA, T. Enunciados e estruturas de predicação no corpus C-ORAL-BRASIL. em preparação.

MERLO, S.; BARBOSA, P. A. Séries temporais de pausas e de hesitações na fala espontânea. Caderno de Estudos Linguísticos. v. 1, n. 54, p. 11-24, 2012. Disponível em: http://revistas.iel.unicamp.br/index.php/cel/article/view/2569. Acesso em: 20 set. 2015.

METTOUCHI, A.; CHANARD, C. From Fieldwork to Annotated Corpora: the CorpAfroAs Project. Faits de Langue-Les Cahiers, n. 2, p. 255-265, 2010.

MITTMANN, M. M. O C-ORAL-BRASIL e o estudo da fala informal: um novo olhar sobre o Tópico no Português Brasileiro. 2012. 248f. Tese (Doutorado em Estudos Linguísticos) - Faculdade de Letras da Universidade Federal de Minas Gerais, UFMG, Belo Horizonte, 2012. Disponível em: http://www.bibliotecadigital.ufmg.br/dspace/ handle/1843/LETR-97YMKT. Acesso em: 20 set. 2015.

MITTMANN, M. M. Análise da estruturação de diálogos e monólogos na fala informal: quantificando as diferenças, Domínios de Lingu@gem, v. 7, p. 338-372, 2013.

MITTMANN, M.; RASO, T. The C-ORAL-BRASIL Informationally Tagged Mini-Corpus. In: MELLO, H. R.; PANUNZI, A.; RASO, T. (Org.). Illocution, modality, attitude, information patterning and speech annotation. Firenze: Firenze University Press, 2012. p. 151-183.

MO, Y.; COLE, J.; LEE, E. Naïve listeners’ prominence and boundary perception. In: SPEECH PROSODY INTERNATIONAL CONFERENCE, 4, 2008, Campinas. Proceedings... Org.: P. A. BARBOSA; S. MADUREIRA; C. REIS (Org.). Campinas: Isca, 2008. p. 735 - 738. Disponível em: http://www.isca-speech.org/archive/sp2008/sp08_735.html. Acesso em: 20 set. 2015.

MONEGLIA, M. The C-ORAL-ROM resource. In: CRESTI, E.; MONEGLIA, M. (Org.). C-ORAL-ROM: integrated reference corpora for spoken Romance languages. Amsterdam/Philadelphia: John Benjamins, 2005. p. 1-70. DOI: http://dx.doi.org/10.1075/scl.15.03mon

MONEGLIA, M. Spoken corpora and pragmatics. Revista Brasileira de Linguística Aplicada, Belo Horizonte, v. 11, n. 2, p. 479-519, 2011. Disponível em: http://www.periodicos.letras.ufmg.br/rbla/arquivos/335.pdf.

MONEGLIA, M.; CRESTI, E. L ́intonazione e i criteri di trascrizione del parlato adulto e infantile. In: BORTOLINI, U.; PIZZUTO, E. (Org.). Il Progetto CHILDES Italia. Pisa: Del Cerro, 1997. p. 57–90.

MONEGLIA, M. et al. Evaluation of consensus on the annotation of terminal and non-terminal prosodic breaks in the C-ORAL-ROM corpus. In: CRESTI, E.; MONEGLIA, M. (Org.). C-ORAL-ROM: integrated reference corpora for spoken Romance languages. Amsterdam: John Benjamins, 2005. p. 257-276.

MONEGLIA, M.; RASO, T. Notes on Language into Act Theory. In: RASO, T; MELLO, H. R. Spoken Corpora and Linguistic Studies. Amsterdam; Filadelphia: John Benjamins, 2014. p. 468-495.

MONEGLIA, M. et al. Challenging the perceptual relevance of prosodic breaks in multilingual spontaneous speech corpora: C-ORAL-BRASIL/C-ORAL-ROM. In: SPEECH PROSODY, Chicago. Proceedings… Chicago, 2010. p. 1-4.

NENCIONI, G. Di scritto e di parlato: discorsi linguistici. Bologna: Zanichelli, 1983.

NESPOR, M.; VOGEL, I. Prosodic phonology. Dordrecht: Foris, 1986.

PANUNZI, A.; MITTMANN, M. The IPIC resource and a cross-linguistic analysis of information structure in Italian and Brazilian Portuguese. In: RASO, T.; MELLO, H. R. Spoken Corpora and Linguistic Studies. Amsterdam; Philadelphia: John Benjamins, 2014. p. 129-151. DOI: http://dx.doi.org/10.1075/scl.61.05pan.

RASO, T. Minicorpus retirado do corpus C-ORAL-BRASIL e etiquetado informacionalmente. Annotation of information patterns according to Language into Act Theory in DB IPIC - first release, 2012a. Disponível em: http://lablita.dit.unifi.it/ipic/.

RASO, T. O corpus C-ORAL-BRASIL. In: RASO, T.; MELLO, H. R. (Org.). C-ORAL-BRASIL I: Corpus de referência do português brasileiro falado informal. Belo Horizonte: Editora UFMG, 2012b. p. 55-90.

RASO, T.; O C-ORAL-BRASIL e a Teoria da Língua em Ato. In: RASO, T; MELLO, H. R. (Org.). C-ORAL-BRASIL I: Corpus de referência do português brasileiro falado informal. Belo Horizonte: Editora UFMG, 2012c. p. 91-124.

RASO, T. Fala e escrita: meio, canal, consequências pragmáticas e linguísticas. Domínios de Lingu@gem, v. 7, p. 12-46, 2013.

RASO, T.; MELLO, H. (Org.). C-ORAL-BRASIL I: corpus de referência do português brasileiro falado informal. Belo Horizonte: Editora UFMG, 2012.

RASO, T.; MITTMANN, M. As principais medidas da fala. In: RASO, T.; MELLO, H. R. (Org.). C-ORAL – BRASIL I: Corpus de referência do português brasileiro falado informal. Belo Horizonte: Editora UFMG, 2012. p. 177-222.

RASO, T.; MITTMANN, M. Validação estatística dos critérios de segmentação da fala espontânea no corpus C-ORAL-BRASIL. Revista de Estudos da Linguagem, v. 17, p. 73-92, 2009. DOI: http://dx.doi.org/10.17851/2237-2083.17.2.73-91.

ROSSI, F. La variazione diamesica. In: SIMONE, R. (Org.). Enciclopedia dell'Italiano. Milano: Treccani, 2011. Disponível em: http://www.treccani.it/enciclopedia/variazione-diamesica_(Enciclopedia_dell'Italiano)/. Acesso em: 20 set. 2015.

SCHUETZE-COBURN, S; SHAPLEY, M; WEBER, E. G. Units of intonation in discourse: a comparison of acoustic and auditory analyses. Language and speech. v. 34, n. 3, p. 207-234, 1991. Disponível em: http://www.ncbi.nlm.nih.gov/pubmed/1843524.0023830991034. Acesso em: 20 set. 2015.

SORIANELLO, P. Prosodia. Roma: Carocci, 2006.

SVENDSEN, T.; SOONG, F. On the automatic segmentation of speech signals. IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING - ICASSP '87, Dallas, 1987. Conferences… Dallas, US: Institute of Electrical & Electronics Engineers (IEEE), 1987. p. 77-80. Disponível em: http://dx.doi.org/10.1109/ICASSP.1987.1169628. Acesso em: 20 set. 2015.

SWERTS, M.; COLLIER, R.; TERKEN, J. Prosodic predictors of discourse finality in spontaneous monologues. Speech Communication, v. 15, n. 1-2, p. 79-90, 1994. Disponível em: http://www.sciencedirect.com/science/article/pii/0167639394900434. Acesso em: 20 set. 2015.

VAN HEMERT, J. P. Automatic segmentation of speech. Ieee Transactions On Signal Processing, Piscataway, v. 39, n. 4, Institute of Electrical & Electronics Engineers (IEEE), p. 1008-1012, abr. 1991.

DOI: http://dx.doi.org/10.1109/78.80941.

ZELLNER, B. Pauses and the temporal structure of speech. In: KELLER, E. (Org.) Fundamentals of speech synthesis and speech recognition. Chichester: John Wiley, 1994. p. 41-62.

DOI: http://dx.doi.org/10.17851/2237-2083.23.3.883-922


  • There are currently no refbacks.


e - ISSN 2237-2083 


Licensed through  Creative Commons Atribuição 4.0 Internacional