Skip to content

Texto para Fala

O playground de texto para fala do SipPulse AI permite testar e comparar o desempenho dos modelos de síntese de voz disponíveis na plataforma. Este ambiente interativo facilita a conversão de texto em áudio, suportando diversos idiomas, vozes e formatos de saída.

Funcionalidades Principais

Configurações de Parâmetros

Ao selecionar um modelo, o playground apresenta os parâmetros disponíveis para ajuste. Esses parâmetros podem incluir:

  • Modelo: Escolha entre os modelos de síntese de voz disponíveis na plataforma.
  • Idioma: Selecione o idioma da fala sintetizada. O modelo ajustará a voz e a pronúncia de acordo com o idioma escolhido.
  • Voz: Escolha entre diferentes vozes disponíveis para o idioma selecionado. Cada voz pode ter características distintas, como gênero e tom.
  • Formato de Saída: Escolha o formato de áudio desejado. Os principais formatos suportados são:
    • MP3: Áudio comprimido com boa qualidade e tamanho de arquivo reduzido.
    • WAV: Áudio sem compressão, com alta qualidade.
    • Opus: Formato de áudio livre e aberto, comprimido, ideal para transmissões de voz.
    • PCM: Áudio sem compressão, com várias taxas de amostragem disponíveis.
    • MULaw e ALaw: Formatos de áudio utilizados em telecomunicações.
    • WebM: Formato de áudio livre e aberto, baseado em Opus.
    • AMR-WB: Formato utilizado em comunicações móveis.

Texto

Insira o texto que deseja converter em fala na área de texto fornecida. O modelo de síntese de voz usará este texto para gerar o áudio correspondente.

Execução do Teste

Após ajustar os parâmetros e inserir o texto, você pode iniciar o teste clicando no botão Executar. O modelo processará o texto e gerará o áudio no formato selecionado.

Reprodução de Áudio

Após a execução do teste e a geração do áudio, um player de áudio será exibido na interface, permitindo que você ouça o resultado diretamente no playground.

Visualização de Código

O playground inclui um botão Ver Código, que mostra como integrar o modelo e os parâmetros testados em suas próprias aplicações. O código de integração pode ser visualizado em diferentes linguagens, incluindo Curl, Python e JavaScript.

Exemplo de Uso

Vamos supor que você queira converter um texto em áudio utilizando o modelo azure-tts com uma configuração específica:

  1. Selecione azure-tts no menu de modelos.
  2. Ajuste os Parâmetros:
    • Idioma: Português (Brasil)
    • Voz: Giovanna
    • Formato de Saída: MP3 (16Khz, 64KBit Rate, Mono)
  3. Insira o Texto: Digite ou cole o texto que deseja converter em fala.
  4. Execute o Teste: Clique em Executar para gerar o áudio a partir do texto inserido.
  5. Ouça o Resultado: Utilize o player de áudio exibido para ouvir o resultado da conversão.
  6. Ver Código: Obtenha o código de integração clicando em Ver Código e escolha a linguagem de sua preferência (Curl, Python ou JavaScript).