Texto para Fala

O playground de texto para fala do SipPulse AI permite testar e comparar o desempenho dos modelos de síntese de voz disponíveis na plataforma. Este ambiente interativo facilita a conversão de texto em áudio, suportando diversos idiomas, vozes e formatos de saída.

Funcionalidades Principais

Configurações de Parâmetros

Ao selecionar um modelo, o playground apresenta os parâmetros disponíveis para ajuste. Esses parâmetros podem incluir:

Modelo: Escolha entre os modelos de síntese de voz disponíveis na plataforma.
Idioma: Selecione o idioma da fala sintetizada. O modelo ajustará a voz e a pronúncia de acordo com o idioma escolhido.
Voz: Escolha entre diferentes vozes disponíveis para o idioma selecionado. Cada voz pode ter características distintas, como gênero e tom.
Formato de Saída: Escolha o formato de áudio desejado. Os principais formatos suportados são:
- MP3: Áudio comprimido com boa qualidade e tamanho de arquivo reduzido.
- WAV: Áudio sem compressão, com alta qualidade.
- Opus: Formato de áudio livre e aberto, comprimido, ideal para transmissões de voz.
- PCM: Áudio sem compressão, com várias taxas de amostragem disponíveis.
- MULaw e ALaw: Formatos de áudio utilizados em telecomunicações.
- WebM: Formato de áudio livre e aberto, baseado em Opus.
- AMR-WB: Formato utilizado em comunicações móveis.

Texto

Insira o texto que deseja converter em fala na área de texto fornecida. O modelo de síntese de voz usará este texto para gerar o áudio correspondente.

Execução do Teste

Após ajustar os parâmetros e inserir o texto, você pode iniciar o teste clicando no botão Executar. O modelo processará o texto e gerará o áudio no formato selecionado.

Reprodução de Áudio

Após a execução do teste e a geração do áudio, um player de áudio será exibido na interface, permitindo que você ouça o resultado diretamente no playground.

Visualização de Código

O playground inclui um botão Ver Código, que mostra como integrar o modelo e os parâmetros testados em suas próprias aplicações. O código de integração pode ser visualizado em diferentes linguagens, incluindo Curl, Python e JavaScript.

Exemplo de Uso

Vamos supor que você queira converter um texto em áudio utilizando o modelo azure-tts com uma configuração específica:

Selecione azure-tts no menu de modelos.
Ajuste os Parâmetros:
- Idioma: Português (Brasil)
- Voz: Giovanna
- Formato de Saída: MP3 (16Khz, 64KBit Rate, Mono)
Insira o Texto: Digite ou cole o texto que deseja converter em fala.
Execute o Teste: Clique em Executar para gerar o áudio a partir do texto inserido.
Ouça o Resultado: Utilize o player de áudio exibido para ouvir o resultado da conversão.
Ver Código: Obtenha o código de integração clicando em Ver Código e escolha a linguagem de sua preferência (Curl, Python ou JavaScript).

Texto para Fala ​

Funcionalidades Principais ​

Configurações de Parâmetros ​

Texto ​

Execução do Teste ​

Reprodução de Áudio ​

Visualização de Código ​

Exemplo de Uso ​