Este repositorio contiene la aplicación de Speech to Text desarrollada en FastAPI con el modelo Whisper. La aplicación convierte el habla en texto utilizando técnicas de procesamiento de voz.
- Construye la imagen de Docker ejecutando el siguiente comando:
docker build -t tolsc-s2t
- Inicia el contenedor de Docker con la imagen creada:
docker run -dp8000:8000 tolsc-s2t
- Realiza las peticiones a través de la API utilizando multipart/formdata con método POST con la llave "audio_file" de la siguiente manera:
http://your.deploy.ip:8000/speech-to-text
También puedes realizar la petición utilizando el siguiente comando de cURL:
curl -X POST -F "audio_file=@audio.m4a" http://your.deploy.ip:8000/speech-to-text
Ten en cuenta que la API solo acepta archivos de audio en formato .m4a
.
- Santiago Fernández (sa.fernandez@javeriana.edu.co)
- Fabian Olarte (olarte_fabian@javeriana.edu.co)
- Mateo Rosero (roseroq-j@javeriana.edu.co)
- Andrés Vásquez (af.vasquezr@javeriana.edu.co)