EcoLMS

EcoLMS — внутренняя платформа для работы с контентом из медиа- и документных источников. Сейчас в репозитории уже реализован workflow генерации обучающих курсов, а для meetings добавлены backend API, схема БД, worker pipeline под SaluteSpeech и UI-раздел /meetings. Репозиторий организован как pnpm-монорепозиторий с четырьмя приложениями: web, api, worker и transcription-service.

Актуальный стек

Workspace: pnpm@10.12.4
Frontend: Next.js 16.2.2, React 19.2.4, TypeScript 5, Tailwind CSS 4, shadcn/ui, react-markdown
Backend API: NestJS 11, TypeScript, pg без ORM, class-validator, class-transformer
Worker: Python, psycopg, boto3, pypdf, python-docx, python-pptx, striprtf
Transcription service: Python http.server, faster-whisper, boto3, ffmpeg
Infrastructure: PostgreSQL 16, Redis 7, S3-compatible storage
LLM providers: OpenAI и OpenRouter

Структура репозитория

apps/web — UI на Next.js с App Router, включая courses и meetings
apps/api — NestJS API для courses, meetings, загрузок, задач, артефактов и health-check
apps/worker — фоновая обработка файлов, генерация этапов курса и pipeline модуля meetings
apps/transcription-service — сервис транскрибации аудио и видео
doc — предметная и инфраструктурная документация
docker — Dockerfile для каждого сервиса

Текущая архитектура

Browser
  -> web (Next.js)
  -> api (NestJS, /api/*)
  -> PostgreSQL
  -> Redis
  -> S3-compatible storage
  -> worker (Python)
  -> transcription-service (Python + faster-whisper)

Как это работает сейчас

Пользователь создаёт проект через web.
api создаёт запись проекта и артефакты-заготовки для этапов: source_compiled, course_outline, course_content, course_test.
Для загрузки файлов api выдаёт параметры multipart upload и signed URL для частей.
Файлы уходят напрямую в S3-compatible storage.
api ставит задачу в Redis-очередь ecolms:processing-jobs.
worker читает задачу, скачивает файлы, извлекает текст или транскрибирует аудио/видео, затем вызывает OpenAI/OpenRouter.
Результаты этапов сохраняются в PostgreSQL как артефакты md и json.
web показывает статус проекта, историю задач и позволяет редактировать Markdown-артефакты.

Реализованные приложения

`apps/web`

один экран-дашборд для списка проектов и карточки проекта;
отдельный экран /meetings в двухпанельной компоновке: список встреч слева, результаты обработки справа;
редактор промптов вынесен на отдельную страницу /prompts и доступен из LMS и meetings;
добавление новой записи встречи прямо из /meetings: создать карточку, загрузить один файл и сразу запустить обработку;
в meetings и LMS используется единый паттерн уведомлений: компактные toast-like alerts в правом нижнем углу;
экран meetings показывает доступность LLM, SaluteSpeech, баз данных и фоновых модулей через health badge, как в LMS;
в левом списке встреч есть меню ... с действиями Информация и Удалить;
в хедере экрана /meetings есть кнопка возврата к основному интерфейсу LMS;
по пункту Информация открывается Sheet с техническими деталями, jobs и артефактами;
markdown для встречи содержит только человекочитаемые разделы: саммари, протокол и поручения;
загрузка до 5 файлов;
поддержка документов, аудио и видео;
запуск генерации отдельных этапов и цепочки этапов;
просмотр и редактирование Markdown-артефактов;
proxy-route для запросов к backend: apps/web/src/app/api/[...path]/route.ts;
proxy-route для PUT загрузки в S3 по signed URL: apps/web/src/app/api/s3-upload/route.ts.

`apps/api`

глобальный префикс маршрутов: /api;
контроллеры: projects, uploads, jobs, artifacts, health, prompts;
health-check агрегирует статус api, postgres, redis, llm, salutespeech, worker, transcription-service;
хранение и миграция минимальной схемы БД выполняются прямо из PostgresService;
таблица llm_prompts хранит редактируемые prompt templates для lms и meetings;
очередь реализована через Redis list, без BullMQ;
presigned URL для S3 формируются собственным кодом, без AWS SDK.

`apps/worker`

обработка очереди из Redis;
скачивание исходников из S3;
извлечение текста из pdf, docx, pptx, rtf, txt;
вызов transcription-service для аудио/видео;
генерация source_compiled, course_outline, course_content, course_test;
вызов только одного выбранного LLM-провайдера (OpenAI или OpenRouter) по LLM_PRIMARY_PROVIDER.
ошибки quota / balance / payment required от LLM и SaluteSpeech нормализуются в человекочитаемый текст для UI и job logs.
prompt templates для lms и meetings читаются из PostgreSQL (llm_prompts), а встроенные prompt definitions используются как seed по умолчанию.

`apps/transcription-service`

HTTP API на встроенном HTTPServer;
endpoint GET /health;
endpoint POST /transcribe;
загрузка источника из S3, URL или локального пути;
нормализация аудио через ffmpeg в 16kHz mono wav;
транскрибация через faster-whisper.

API и данные

Актуальные маршруты и схема данных описаны в:

Зафиксированное развитие

Для нового модуля meetings уже зафиксированы и частично реализованы такие решения:

отдельный bounded context, не смешанный с workflow курсов;
язык встреч в V1: только русский;
один файл на встречу;
целевой провайдер распознавания и диаризации: SaluteSpeech;
канонический результат хранится в PostgreSQL, а сырой ответ провайдера сохраняется в job result_json;
ручная правка speaker labels предусмотрена в UI и модели данных;
UI-раздел /meetings уже добавлен и показывает список встреч, карточку встречи и единый markdown-файл.

Что уже есть в backend:

таблицы meetings, meeting_source_files, meeting_upload_sessions, meeting_jobs, meeting_speakers, meeting_speaker_segments, meeting_artifacts;
REST-маршруты /api/meetings/*;
отдельная Redis-очередь ecolms:meeting-jobs;
worker pipeline audio_prepared -> transcript_compiled -> meeting_summary -> meeting_protocol -> meeting_actions;
интеграция worker с SaluteSpeech через async API и нормализацию diarized transcript в PostgreSQL.

Локальный запуск

Создать .env на основе .env.example.
Установить зависимости: pnpm install.
Поднять локальные Postgres + Redis: pnpm dev:infra:up.
Запустить API: pnpm dev:api.
Запустить web: pnpm dev:web.
При необходимости запустить transcription service: pnpm dev:transcription.
При необходимости запустить worker: pnpm dev:worker.

Примечание: pnpm dev:worker использует uv и зависимости из apps/worker/pyproject.toml, а для обработки встреч meetings worker требует доступный ffmpeg.

Основные команды

pnpm dev — web
pnpm dev:web — web
pnpm dev:api — api
pnpm dev:worker — worker
pnpm dev:transcription — transcription-service
pnpm build — build web + api
pnpm lint — lint web
pnpm docker:up — поднять стек через Docker Compose
pnpm docker:down — остановить стек

Переменные окружения

Ключевые переменные:

ECOLMS_API_BASE_URL
POSTGRES_URL
REDIS_URL
S3_ENDPOINT
S3_BUCKET
S3_REGION
S3_ACCESS_KEY_ID
S3_SECRET_ACCESS_KEY
OPENAI_API_KEY
OPENROUTER_API_KEY
LLM_PRIMARY_PROVIDER
OPENAI_MODEL
OPENROUTER_MODEL
LLM_TIMEOUT_SECONDS
TRANSCRIPTION_SERVICE_URL
WHISPER_MODEL_SIZE
WHISPER_COMPUTE_TYPE
WORKER_JOB_QUEUE_KEY
WORKER_MEETING_JOB_QUEUE_KEY
SALUTESPEECH_AUTH_KEY
SALUTESPEECH_OAUTH_URL
SALUTESPEECH_REST_URL
SALUTESPEECH_UPLOAD_URL
SALUTESPEECH_RECOGNIZE_URL
SALUTESPEECH_TASK_URL
SALUTESPEECH_DOWNLOAD_URL
SALUTESPEECH_SCOPE
SALUTESPEECH_MODEL
SALUTESPEECH_LANGUAGE
SALUTESPEECH_CA_CERT_PATH
SALUTESPEECH_SSL_NO_VERIFY
SALUTESPEECH_POLL_INTERVAL_SECONDS
SALUTESPEECH_TIMEOUT_SECONDS

Для обратной совместимости api и worker также понимают старые алиасы SBER_* и могут собрать OAuth Basic key из SBER_CLIENT_ID + SBER_CLIENT_SECRET, если SALUTESPEECH_AUTH_KEY не задан. SALUTESPEECH_AUTH_KEY допускает три формата: готовый base64, строку client_id:client_secret или значение с префиксом Basic .

Если используется SALUTESPEECH_CA_CERT_PATH=certs/russiantrustedca.pem, каталог certs/ должен быть скопирован в runtime-образ worker, иначе этап transcript_compiled завершится системной ошибкой [Errno 2] No such file or directory.

Полный пример находится в .env.example.

Name		Name	Last commit message	Last commit date
Latest commit History 94 Commits
.codex/environments		.codex/environments
apps		apps
certs		certs
doc		doc
docker		docker
scripts		scripts
.dockerignore		.dockerignore
.env.example		.env.example
.gitignore		.gitignore
AGENTS.md		AGENTS.md
README.md		README.md
docker-compose.dokploy.yml		docker-compose.dokploy.yml
docker-compose.ui-infra.yml		docker-compose.ui-infra.yml
docker-compose.yml		docker-compose.yml
package.json		package.json
pnpm-lock.yaml		pnpm-lock.yaml
pnpm-workspace.yaml		pnpm-workspace.yaml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

EcoLMS

Актуальный стек

Структура репозитория

Текущая архитектура

Как это работает сейчас

Реализованные приложения

`apps/web`

`apps/api`

`apps/worker`

`apps/transcription-service`

API и данные

Зафиксированное развитие

Локальный запуск

Основные команды

Переменные окружения

About

Uh oh!

Releases

Packages

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

EcoLMS

Актуальный стек

Структура репозитория

Текущая архитектура

Как это работает сейчас

Реализованные приложения

apps/web

apps/api

apps/worker

apps/transcription-service

API и данные

Зафиксированное развитие

Локальный запуск

Основные команды

Переменные окружения

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

`apps/web`

`apps/api`

`apps/worker`

`apps/transcription-service`

Packages