Skip to content

cucumberian/gigaam-api

Repository files navigation

GigaAM Fastapi

Простой апи для работы с распознавания речи через gigaam.

Поддержка коротких аудио длинной до 25сек.

Использовался репозиторий GigaAM.

Версии

  • v1.1.0
    • поправлена ошибка с версией gigaam, которая берётся теперь напрямую из официального репозитория.
    • поэтому появилась поддержка 3й версии моделей
    • добавил emo модель и роут для получения интенции
  • v1.0.0 - /transcribe роутер для запуска подели

Запуск

docker-compose up --build

Описание

Бэк запускается в режиме с очередью в 2 обработки с 1 обработкой одновременно. Последовательную обработку обеспечивает 1 воркер uvicorn.

Используется цпу версия торча для запуска на слабом железе без гпу и для снижения веса образа.

Объем образа 2.3ГБ, объем волюма после скачивания моделек 900МБ.

About

api for speach recognithion with gigaam model

Topics

Resources

Stars

Watchers

Forks

Contributors