Простой апи для работы с распознавания речи через gigaam.
Поддержка коротких аудио длинной до 25сек.
Использовался репозиторий GigaAM.
v1.1.0- поправлена ошибка с версией gigaam, которая берётся теперь напрямую из официального репозитория.
- поэтому появилась поддержка 3й версии моделей
- добавил
emoмодель и роут для получения интенции
v1.0.0-/transcribeроутер для запуска подели
docker-compose up --buildБэк запускается в режиме с очередью в 2 обработки с 1 обработкой одновременно. Последовательную обработку обеспечивает 1 воркер uvicorn.
Используется цпу версия торча для запуска на слабом железе без гпу и для снижения веса образа.
Объем образа 2.3ГБ, объем волюма после скачивания моделек 900МБ.