"Разработка конструктора презентаций для учителей с поддержкой видео и ИИ-генерации слайдов"
Современные педагоги тратят огромное количество времени на подготовку учебных материалов. Создание качественной, визуально привлекательной и методически верной презентации — это трудоемкий процесс, требующий навыков работы с несколькими программами, поиска контента и его структурирования.
Ключевые проблемы, с которыми сталкиваются учителя:
- Высокие временные затраты: Рутинные задачи по созданию слайдов отнимают время от более важных аспектов преподавания.
- "Боязнь белого листа": Сложность в генерации идей и структуры для новой презентации.
- Технические барьеры: Необходимость осваивать сложные программы для добавления мультимедиа (видео, аудио) и последующего экспорта в нужные форматы.
- Недостаток контента: Трудности с поиском релевантных изображений и написанием лаконичных текстов для слайдов.
SmartSlides — это инновационный веб-сервис, который решает эти проблемы, используя мощь генеративного ИИ и современный технологический стек. Мы предлагаем не просто редактор, а интеллектуального ассистента, который берет на себя самую сложную часть работы.
Мы создаем интуитивно понятную веб-платформу, где учитель может за несколько минут сгенерировать основу для целой презентации, просто описав тему текстом. AI-ассистент предложит структуру, напишет тексты для слайдов и подберет ключевые слова для визуализаций, а мощный редактор позволит "довести до блеска" результат и добавить мультимедиа.
-
Фундамент (Core Functionality):
- Разработка редактора слайдов: Создание интерфейса на React и Kanva.js для добавления и стилизации базовых элементов (текст, изображения, фигуры).
- Интеграция ИИ-ядра: Настройка сервера NVIDIA Triton с моделью Qwen 3 и создание API на FastAPI для обработки запросов к ИИ.
-
Интеллектуальная генерация (AI Features):
- Реализация чата с AI-ассистентом: Пользователь вводит тему, а система генерирует готовую структуру презентации в формате JSON.
- Динамическая отрисовка: Фронтенд парсит полученный JSON и автоматически создает слайды с контентом на холсте.
-
Расширенные возможности (Advanced Features):
- Поддержка мультимедиа: Внедрение функционала для вставки видео (по ссылке и загрузкой) и аудио.
- Универсальный экспорт: Реализация экспорта готовых презентаций в форматы PDF и PPTX.
-
Администрирование и кастомизация:
- Разработка панели администратора: Создание интерфейса для управления шаблонами и гибкой настройки параметров ИИ-модели (system prompt, temperature и т.д.).
Что позволит нам создать продукт, превосходящий аналоги, и почему наша работа заслуживает высокой оценки:
-
Современный и производительный стек: Мы используем NVIDIA Triton Inference Server, промышленный стандарт для высоконагруженных AI-сервисов. Это обеспечивает максимальную скорость и эффективность работы модели Qwen 3 8B, что критически важно для комфортного пользовательского опыта.
-
Микросервисная архитектура и DevOps: Проект изначально строится на Docker и автоматизирован с помощью GitHub Actions. Это не просто набор скриптов, а полноценный CI/CD-пайплайн, который гарантирует стабильность, масштабируемость и высокое качество кода с первого дня разработки.
-
Глубокая интеграция ИИ, а не поверхностная: Мы не просто генерируем текст. Наш AI-ассистент создает структурированные данные (JSON), описывающие всю презентацию — от заголовков до подсказок по визуализации. Это позволяет нам гибко управлять отображением, создавать сложные шаблоны и легко внедрять новые AI-функции в будущем. Помимо этого, ассистент имеет возможность редактирования отдельных частей презентации, начиная с текстовых полей и заканчивая целым слайдом.
-
Фокус на образовательной специфике: Возможность для администраторов тонко настраивать системные промпты и параметры модели позволит адаптировать генерируемый контент под конкретные образовательные стандарты и возрастные группы, делая наш инструмент по-настоящему полезным для учителей.
На данный момент в проекте реализованы два ключевых экрана, которые составляют основу MVP (минимально жизнеспособного продукта) и демонстрируют основной функционал.
- Приветственный экран (Страница входа) Полноценная посадочная страница, которая знакомит пользователя с проектом и предоставляет доступ к редактору.
- Информационный блок: Краткое описание возможностей приложения и его преимуществ.
- Форма аутентификации: Безопасный вход в систему для начала работы.
- Современный дизайн: Приятный и интуитивно понятный пользовательский интерфейс.
- Редактор презентаций Интерактивное рабочее пространство, где происходит вся магия создания и редактирования слайдов.
- Добавление фигур (прямоугольник, круг, треугольник), текста и изображений.
- Интерактивное выделение, перемещение, масштабирование и вращение объектов.
- Панель управления слайдами: Удобное добавление, удаление и переключение между слайдами.
- Инспектор свойств: Детальная настройка выбранного объекта — изменение координат, размеров, цвета, текста и шрифта.
- Функции экспорта: Возможность сохранять готовую презентацию в форматах PDF и JSON.
- ИИ-ассистент
Текущий статус: Бэкенд для ИИ-генерации подготовлен
На данный момент полностью развернут и готов к интеграции высокопроизводительный сервис для генерации контента. В качестве основы используется NVIDIA Triton Inference Server, запущенный в Docker-контейнере. Для поддержки GGUF-моделей был написан кастомный Python-бэкенд, позволяющий Triton'у обслуживать state-of-the-art LLM, такие как Qwen3-8B. Весь пайплайн настроен на максимальное использование GPU-ускорения, благодаря чему достигнута высокая скорость генерации, необходимая для комфортной работы пользователей. Сервис предоставляет стабильный HTTP API и ожидает интеграции с основным бэкендом приложения. Настроена связь между frontend и backend с помощью python fastapi, работают основные запросы, например авторизация.