Skip to content

Speech to text service for toLSC app implemented with OpenAI Whisper model

Notifications You must be signed in to change notification settings

toLSC/tolsc-speech-to-text

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

8 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

toLSC Speech To Text API 🎙️📝

Este repositorio contiene la aplicación de Speech to Text desarrollada en FastAPI con el modelo Whisper. La aplicación convierte el habla en texto utilizando técnicas de procesamiento de voz.

Instrucciones de Uso

  1. Construye la imagen de Docker ejecutando el siguiente comando:
docker build -t tolsc-s2t
  1. Inicia el contenedor de Docker con la imagen creada:
docker run -dp8000:8000 tolsc-s2t
  1. Realiza las peticiones a través de la API utilizando multipart/formdata con método POST con la llave "audio_file" de la siguiente manera:
http://your.deploy.ip:8000/speech-to-text

También puedes realizar la petición utilizando el siguiente comando de cURL:

curl -X POST -F "audio_file=@audio.m4a" http://your.deploy.ip:8000/speech-to-text

Ten en cuenta que la API solo acepta archivos de audio en formato .m4a.

Colaboradores

About

Speech to text service for toLSC app implemented with OpenAI Whisper model

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published