Fala para Texto
Visão Geral
O playground de fala para texto do SipPulse AI permite testar e comparar o desempenho dos modelos de transcrição de áudio disponíveis na plataforma. Este ambiente interativo facilita a conversão de arquivos de áudio em texto, suportando diversos formatos de saída e tradução automática.
Funcionalidades Principais
Upload de Áudio
No playground, você pode fazer o upload de arquivos de áudio de duas maneiras:
- Arrastar e Soltar: Arraste o arquivo de áudio para a área designada.
- Selecionar Arquivo: Clique na área designada para escolher um arquivo de áudio do seu dispositivo.
Configurações de Parâmetros
Ao selecionar um modelo, o playground apresenta os parâmetros disponíveis para ajuste. Esses parâmetros podem incluir:
Modelo: Escolha entre os modelos de transcrição de áudio disponíveis na plataforma.
Formato: Escolha o formato de saída desejado. Os formatos suportados são:
- Texto: Transcrição simples em formato de texto.
- JSON: Saída em formato JSON.
- VTT: Formato WebVTT, utilizado para legendas em vídeos.
- SRT: Formato SubRip Subtitle, também utilizado para legendas.
- Verbose JSON: JSON detalhado, incluindo informações adicionais sobre a transcrição.
Idioma: Selecione o idioma do áudio a ser transcrito.
DICA
Se o idioma do áudio for diferente do idioma selecionado, a resposta será a tradução do áudio para o idioma selecionado.
Instruções
Você pode adicionar instruções específicas para o modelo, orientando a forma como a transcrição deve ser feita. Este campo é opcional, mas pode ajudar a obter resultados mais precisos conforme suas necessidades.
Execução do Teste
Após ajustar os parâmetros e fazer o upload do áudio, você pode iniciar o teste clicando no botão Transcrever
. O modelo processará o áudio e exibirá a transcrição no formato selecionado.
Visualização de Código
O playground inclui um botão Ver Código
, que mostra como integrar o modelo e os parâmetros testados em suas próprias aplicações. O código de integração pode ser visualizado em diferentes linguagens, incluindo Curl, Python e JavaScript.
Exemplo de Uso
Vamos supor que você queira transcrever um arquivo de áudio utilizando o modelo whisper-1
com uma configuração específica:
- Selecione
whisper-1
no menu de modelos. - Faça o Upload do Áudio: Arraste e solte o arquivo de áudio na área designada ou clique para selecionar o arquivo.
- Ajuste os Parâmetros:
- Formato: Texto
- Idioma: Português
- Instrução: (Opcional) "Transcreva com a maior precisão possível."
- Execute o Teste: Clique em
Transcrever
para ver a transcrição do áudio. - Ver Código: Obtenha o código de integração clicando em
Ver Código
e escolha a linguagem de sua preferência (Curl, Python ou JavaScript).