# Acoustic-prosodic measures discriminate the emotions of Brazilian portuguese speakers

**Authors:** Alexandra Christine de Aguiar, Ana Carolina Constantini, Ronei Marcos de Moraes, Anna Alice Almeida, Alexandra Christine de Aguiar, Ana Carolina Constantini, Ronei Marcos de Moraes, Anna Alice Almeida

PMC · DOI: 10.1590/2317-1782/e20240116en · 2025-08-04

## TL;DR

This study shows that acoustic-prosodic features like speech duration and pitch can distinguish different emotions in Brazilian Portuguese speakers.

## Contribution

The study identifies specific acoustic-prosodic patterns for each emotion in Brazilian Portuguese speech.

## Key findings

- Disgust had the highest speech duration, while joy showed faster speech and higher intensity.
- Fear and sadness had lower intensity and pitch, with fear showing minimal segment elongation.
- Surprise had the highest pitch, and anger had the highest vocal intensity.

## Abstract

To verify if there is a difference in acoustic-prosodic measures in different emotional states of speakers of Brazilian Portuguese (BP).

The data sample consisted of 182 audio signals produced by actors (professionals or students), from the semi-spontaneous speech task “Look at the blue plane” in the various emotions (joy, sadness, fear, anger, surprise, disgust) and neutral emission. Values were extracted from acoustic-prosodic measures of duration, fundamental frequency and intensity of the various emotions. The Friedman comparison test was used to verify whether these measures are able to discriminate emotions.

The prosodic-acoustic analysis revealed significant variations between emotions. The disgust emotion stood out for having the highest rate of utterance, with higher values of duration. In contrast, the joy exhibited a more accelerated speech, with lower values of duration and greater intensity. Sadness and fear were marked by lower intensity and lower frequencies, and fear presented the lowest positive asymmetry values of z-score and z-smoothed, with less elongation of the segments. Anger was highlighted by the higher vocal intensity, while surprise recorded the highest values of fundamental frequency.

The acoustic-prosodic measures proved to be effective tools for differentiating emotions in CP speakers. These parameters have great potential to discern different emotional states, broaden knowledge about vocal expressiveness and open possibilities for emotion recognition technologies with applications in artificial intelligence and mental health.

Verificar se há diferença de medidas acústico-prosódicas em diferentes estados emocionais de falantes do português brasileiro (PB).

A amostra de dados consistiu em 182 sinais de áudio produzidos por atores (profissionais ou estudantes), a partir da tarefa de fala semi-espontânea “Olha lá o avião azul” nas variadas emoções (alegria, tristeza, medo, raiva, surpresa, nojo) e emissão neutra. Foram extraídos valores das medidas acústico-prosódicas de duração, frequência fundamental e intensidade das variadas emoções. Utilizou-se o teste de comparação de Friedman para verificar se essas medidas são capazes de discriminar as emoções.

A análise acústico-prosódica revelou variações significativas entre as emoções. A emoção nojo destacou-se por apresentar a maior taxa de elocução, com valores mais altos de duração. Em contraste, a alegria exibiu uma fala mais acelerada, com menores valores de duração e maior intensidade. A tristeza e o medo foram marcados por menor intensidade e frequências mais baixas, sendo que o medo apresentou os menores valores de assimetria positiva de z-score e z-suavizado, com menor alongamento dos segmentos. A raiva se sobressaiu pela maior intensidade vocal, enquanto a surpresa registrou os valores mais altos de frequência fundamental.

As medidas acústico-prosódicas demonstraram ser ferramentas eficazes para diferenciar emoções em falantes do PB. Esses parâmetros têm grande potencial para discernir diferentes estados emocionais, ampliam o conhecimento sobre a expressividade vocal e abrem possibilidades para tecnologias de reconhecimento de emoções, com aplicações em inteligência artificial e saúde mental.

## Full-text entities

- **Diseases:** communication disorders (MESH:D003147)
- **Chemicals:** BR (MESH:D001966), EMOVOX (-)
- **Species:** Cada [taxon 1712019], Homo sapiens (human, species) [taxon 9606]

---
Source: https://tomesphere.com/paper/PMC12323398