Please use this identifier to cite or link to this item: http://monografias.ufrn.br/handle/123456789/6728
Title: Geração de prosódia para o português brasileiro em sistemas text-to-speech
Other Titles: Prosody generation for Brazilian Portuguese in text-to-speech systems
Authors: Sá, Felipe Cortez de
Keywords: text-to-speech;prosódia;voice user interfaces;prosody
Issue Date: 20-Jun-2018
Publisher: Universidade Federal do Rio Grande do Norte
Citation: SÁ, Felipe Cortez de. Geração de prosódia para o português brasileiro em sistemas text-to-speech. 2018. 54f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) - Departamento de Informática e Matemática Aplicada, Universidade Federal do Rio Grande do Norte, Natal, 2018.
Portuguese Abstract: Com a cada vez mais forte presença de smartphones e home assistants no cotidiano, grandes empresas de tecnologia vêm desenvolvendo sistemas de conversação baseados em fala, denominadas voice user interfaces. Apesar dos avanços, é perceptível que os sistemas de síntese de voz, especialmente para o português brasileiro, deixam a desejar quanto à naturalidade da fala gerada. Um dos fatores principais que contribuem para isso é a prosódia, isto é, entoação, ritmo e acento da fala. Este trabalho investiga sistemas textto- speech existentes através do estudo de seus algoritmos para síntese de voz e geração de prosódia para diversas línguas, com foco no português brasileiro. São explicitados os desafios encontrados, é feito um levantamento de modelos de análise prosódica na fonologia e propõem-se possíveis soluções para tornar a geração de voz mais próxima à humana.
Abstract: With the evergrowing presence of smartphones and home assistants in our daily lives, technology companies have been developing two-way conversation systems, that is, voice user interfaces. Despite its recent improvements, text-to-speech programs still sound artificial, especially for their Brazilian Portuguese voices. A big contributing factor for that is the lack of accurate prosody, that is, pitch, length and emphasis. This thesis explores existing text-to-speech systems, especially those for which there are Brazilian Portuguese voices, focusing on their prosody generation modules. We highlight challenges of prosody generation, review prosodic analysis in the intonational phonology field and propose possible solutions for improving text-to-speech quality.
URI: http://monografias.ufrn.br/jspui/handle/123456789/6728
Other Identifiers: 2012912357
Appears in Collections:Ciência da Computação

Files in This Item:
File Description SizeFormat 
GeraçaoProsodia_Sa_2018.pdfMonografia939,94 kBAdobe PDFThumbnail
View/Open


This item is licensed under a Creative Commons License Creative Commons