Texto para Fala
O playground de texto para fala do SipPulse AI permite testar e comparar o desempenho dos modelos de síntese de voz disponíveis na plataforma. Este ambiente interativo facilita a conversão de texto em áudio, suportando diversos idiomas, vozes e formatos de saída.
Funcionalidades Principais
Configurações de Parâmetros
Ao selecionar um modelo, o playground apresenta os parâmetros disponíveis para ajuste. Esses parâmetros podem incluir:
- Modelo: Escolha entre os modelos de síntese de voz disponíveis na plataforma.
- Idioma: Selecione o idioma da fala sintetizada. O modelo ajustará a voz e a pronúncia de acordo com o idioma escolhido.
- Voz: Escolha entre diferentes vozes disponíveis para o idioma selecionado. Cada voz pode ter características distintas, como gênero e tom.
- Formato de Saída: Escolha o formato de áudio desejado. Os principais formatos suportados são:
- MP3: Áudio comprimido com boa qualidade e tamanho de arquivo reduzido.
- WAV: Áudio sem compressão, com alta qualidade.
- Opus: Formato de áudio livre e aberto, comprimido, ideal para transmissões de voz.
- PCM: Áudio sem compressão, com várias taxas de amostragem disponíveis.
- MULaw e ALaw: Formatos de áudio utilizados em telecomunicações.
- WebM: Formato de áudio livre e aberto, baseado em Opus.
- AMR-WB: Formato utilizado em comunicações móveis.
Texto
Insira o texto que deseja converter em fala na área de texto fornecida. O modelo de síntese de voz usará este texto para gerar o áudio correspondente.
Execução do Teste
Após ajustar os parâmetros e inserir o texto, você pode iniciar o teste clicando no botão Executar
. O modelo processará o texto e gerará o áudio no formato selecionado.
Reprodução de Áudio
Após a execução do teste e a geração do áudio, um player de áudio será exibido na interface, permitindo que você ouça o resultado diretamente no playground.
Visualização de Código
O playground inclui um botão Ver Código
, que mostra como integrar o modelo e os parâmetros testados em suas próprias aplicações. O código de integração pode ser visualizado em diferentes linguagens, incluindo Curl, Python e JavaScript.
Exemplo de Uso
Vamos supor que você queira converter um texto em áudio utilizando o modelo azure-tts
com uma configuração específica:
- Selecione
azure-tts
no menu de modelos. - Ajuste os Parâmetros:
- Idioma: Português (Brasil)
- Voz: Giovanna
- Formato de Saída: MP3 (16Khz, 64KBit Rate, Mono)
- Insira o Texto: Digite ou cole o texto que deseja converter em fala.
- Execute o Teste: Clique em
Executar
para gerar o áudio a partir do texto inserido. - Ouça o Resultado: Utilize o player de áudio exibido para ouvir o resultado da conversão.
- Ver Código: Obtenha o código de integração clicando em
Ver Código
e escolha a linguagem de sua preferência (Curl, Python ou JavaScript).