Automatic Speech Segmentation in French / Segmentação automática da fala em francês

Philippe Martin

Abstract


Abstract: Whether we read aloud or silently, we segment speech not in words, but in accent phrases, i.e. sequences containing only one stressed syllable (excluding emphatic stress). In lexically stressed languages such as Italian or English, the location of stress in a noun, an adverb, a verb or an adjective (content words) is defined in the lexicon, and accent phrases include one single content word together with its associated grammatical words. In French, a language deprived from lexical stress, accent phrases are defined by the time it takes to read or pronounce them. Therefore, actual phrasing, i.e. the segmentation into accent phrases, depends strongly on the speech rate chosen by the speaker or the reader, whether in oral or silent reading mode. With a slow speech rate, all content words form accent phrases whose final syllables are stressed, whereas a fast speech rate could merge up to 10 or 11 syllables together in a single accent phrase with more than one content word. Based on this observation, and on other properties of stressed syllables, a computer algorithm for automatic phrasing, operating in a top-down fashion, is presented and applied to two examples of read and spontaneous speech.

Keywords: accent phrase; French; phrasing; stress location; boundary detection.

Resumo: Quando lemos em voz alta ou silenciosamente, segmentamos a fala em palavras, mas em grupos acentuais, i.e., sequências contendo uma única sílaba acentuada (excluindo-se acento enfático). Em línguas lexicalmente acentuadas como o italiano ou o inglês, a localização do acento em um substantivo, um advérbio, um verbo ou em um adjetivo (palavras lexicais) é definida no léxico, e sintagmas acentuais incluem uma única palavra lexical, acompanhada das palavras gramaticais a ela associadas. Em francês, uma língua que não possui acento lexical, sintagmas acentuais são definidos pelo tempo que se leva para lê-los ou pronunciá-los. Assim, os constituintes concretos, i.e., a segmentação em grupos acentuais, depende fortemente da velocidade de fala escolhida pelo falante ou leitor, tanto na fala como na leitura silenciosa. Com uma velocidade de fala baixa, todas as palavras lexicais formam grupos acentuais cujas sílabas finais são acentuadas, enquanto o ritmo de fala rápido poderia juntar de 10 a 11 sílabas em um mesmo grupo acentual contendo mais de uma palavra lexical. Com base nessa observação e em outras propriedades das sílabas acentuadas, um algoritmo computacional para segmentação automática, atuando de maneira top-down é apresentado e aplicado a dois exemplos de leitura e fala espontânea.

Palavras-chave: grupo acentual; francês; segmentação; posição do acento; detecção de fronteira.


Keywords


accent phrase; French; phrasing; stress location; boundary detection.

Full Text:

PDF

References


ARNAL, L. ; GIRAUD, A-L. Neurophysiologie de la perception de la parole et multisensorialité. In : PINTO, Serge ; SATO, Marc (Éd.). Traité de neurolinguistique. Louvain-la-Neuve : De Boeck, 2017. p. 97-108.

ARNOLD, D.; WAGNER, P. The influence of top-down expectations on the perception of syllable prominence. In: TUTORIAL AND RESEARCH WORKSHOP ON EXPERIMENTAL LINGUISTICS (ISCA), 2., Athens, Greece, 2008. Proceedings… Athens: University of Athens, 2008. p. 25-28,

ASTÉSANO, C. ; BERTRAND, R. Accentuation et niveaux de constituance en français : enjeux phonologiques et psycholinguistiques. Langue Française, Paris, v. 191, n. 3, p. 11-30, 2016. Doi: 10.3917/lf.191.0011

AVANZI, M. Note de recherche sur l’accentuation et le phrasé à la lumière des corpus du français. Tranel, Neuchâtel, Suisse, v. 58, p. 5-24, 2013.

CHRISTODOULIDES, G.; AVANZI, M. An Evaluation of Machine Learning Methods for Prominence Detection in French. In: ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION, 15., 2014, Singapore. Proceedings... Singapore : International Speech Communication Association (ISCA), 2014. p. 116-119.

DI CRISTO, A. Les musiques du français parlé. Berlin : De Gruyter Mouton, 2016.

GARDE, P. L’accent. Paris : Presses Universitaires de France, 1968. (Collection SUP « Le linguiste », n. 5)

GARDE, P. L’accent. Paris : Lambert-Lucas, 2013.

GOLDMAN, J-P. ; AUCHLIN, A. ; ROEKHAUT, S. ; SIMON, A-C. ; AVANZI, M. Prominence perception and accent detection in French. A corpus-based account. Language Science, Elsevier, v. 39, p. 95-106, 2013.

GHITZA, O.; GREENBERG, S., On the possible role of brain rhythms in speech perception: intelligibility of time-compressed speech with periodic and aperiodic insertions of silence. Phonetica, Basel, Suisse, v. 66, n. 1-2, p. 113-126, 2009.

LEHKA, I. ; LE GAC, D. Etude d’un marqueur prosodique de l’accent de banlieue. In : JOURNÉES D’ÉTUDES SUR LA PAROLE, XXV., Fès, Maroc, avril 2004. Actes... Fès, Maroc : Association Francophone de la Communication Parlée, 2004. Disponible sur : http://www.afcp-parole.org/doc/Archives_JEP/2004_XXVe_JEP_Fes/actes/jep2004/Lehka-LeGac.pdf. Accessed on January 12th, 2018.

LANGUE FRANÇAISE. La prosodie du français : accentuation et phrasé. Paris , v. 191, n. 3, 2016. 150 p. Doi: 10.3917/lf.191.0005

MARTIN, Ph. Analyse phonologique de la phrase française. Linguistics, v. 146, p. 3568, Fév. 1975.

MARTIN, Ph. La transcription des proéminences accentuelles : mission impossible ? Bulletin PFC, Toulouse, n. 6, p. 81-87, Sept. 2006.

MARTIN, Ph. Spontaneous speech corpus data validates prosodic constraints. In: INTERNATIONAL CONFERENCE ON SPEECH PROSODY, 6., 2012, Shangai, China. Proceedings… Shangai: Tongji University Press, 2014. p. 525-529.

MARTIN, Ph. The Structure of Spoken Language. Intonation in Romance. Cambridge: Cambridge University Press, 2015.

MARTIN, Ph. Intonation, structure prosodique et ondes cérébrales. London: ISTE Editions, 2018.

MEIGRET, L. Le tretté de la grammére françoéze. Paris : C. Wechel, 1550. Disponible sur : http://gallica.bnf.fr/ark:/12148/bpt6k507854/f1.image. Accessed on January 12th, 2018.

MERTENS, P.; SIMON, A-C. Towards automatic detection of prosodic boundaries in spoken French. In: PROSODY-DISCOURSE INTERFACE CONFERENCE (IDP-2013), 2013, Leuven. Proceedings… Leuven: KU Leuven, 2013. p. 81-87.

METTOUCHI, A.; LACHERET-DUJOUR, A.; SILBER-VAROD, V.; IZRE, Shlomo El. Only Prosody ? Perception of speech segmentation in Kabyle and Hebrew. Cahiers de Linguistique Française, Genève, v. 28, p. 207-218, 2007.

MICHELAS, A.; FRAUENFELDER, U. H.; SCHÖN, D.; DUFOUR, S. How deaf are French speakers to stress? Journal of the Acoustical Society of America, [s.l.], v. 139, n. 3, p. 1333-1342, 2016. Doi: https://doi.org/10.1121/1.4944574

ROSSI, M. Le seuil de glissando ou seuil de perception des variations tonales pour la parole. Phonetica, Aix-en-Provence, n. 23, p. 1-33, 1971. Doi: 10.1159/000259328

SELKIRK, E. O. On prosodic structure and its relation to syntactic structure. In: FRETHEIM, T. (Ed.). Nordic Prosody II. Trondheim: TAPIR, 1978. p. 111-140.

VÄÄNÄNEN, V. Introducción al latin vulgar. Madrid: Editorial Gredos, 1995.

WIOLAND, F. Les structures rythmiques du français. Paris : Slatkine-Champion, 1985.




DOI: http://dx.doi.org/10.17851/2237-2083.26.4.1551-1570

Refbacks

  • There are currently no refbacks.
';



Copyright (c) 2018 Philippe Martin

Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.

e - ISSN 2237-2083 

License

Licensed through  Creative Commons Atribuição 4.0 Internacional    

Image result for fapemig

Grant #APL-00427-17 (2018-2019)