Document Q&A SaaS Backend

A Node.js/TypeScript backend for a Document Q&A SaaS application that allows users to upload documents (PDF, DOCX, TXT) and ask questions about their content using AI.

Features

Document Processing: Support for PDF, DOCX, and TXT files
Text Chunking: Intelligent text splitting with overlap for better context
Vector Embeddings: Using transformers.js for local embedding generation
Q&A System: Local Llama model integration for intelligent question answering
RAG Pipeline: Retrieval-Augmented Generation for accurate answers
TypeScript: Full type safety with strict configuration
SQLite Database: Prisma ORM with SQLite for development

Tech Stack

Runtime: Node.js 18+ with TypeScript 5+
Framework: Express.js with TypeScript
Database: SQLite with Prisma ORM
Document Processing: pdf-parse, mammoth
Embeddings: @xenova/transformers (all-MiniLM-L6-v2)
Q&A: Local Llama model
File Upload: Multer with validation

Quick Start

Prerequisites

Node.js 18+
npm or yarn
Local Llama model file

Installation

Clone and install dependencies:
```
npm install
```

Set up environment variables:

cp .env.example .env

Edit .env and configure your local Llama model:

LLAMA_MODEL_PATH="./models/llama-2-7b-chat.gguf"
LLAMA_MODEL_TYPE="llama-2-7b-chat"

Set up the database:
```
npm run db:generate
npm run db:migrate
```
Start the development server:
```
npm run dev
```

The server will start on http://localhost:3001

API Endpoints

Health Check

GET /health - Server health status

Documents

GET /api/documents - List all documents
GET /api/documents/:id - Get specific document
POST /api/documents - Upload new document
DELETE /api/documents/:id - Delete document
GET /api/documents/:id/chunks - Get document chunks

Q&A

POST /api/qa/ask - Ask question about document
GET /api/qa/models - Get AI model information
POST /api/qa/batch - Ask multiple questions

Usage Examples

Upload a Document

curl -X POST http://localhost:3001/api/documents \
  -F "file=@document.pdf" \
  -F "userId=user123"

Ask a Question

curl -X POST http://localhost:3001/api/qa/ask \
  -H "Content-Type: application/json" \
  -d '{
    "documentId": "doc_id_here",
    "question": "What is the main topic of this document?",
    "userId": "user123"
  }'

Get Document List

curl http://localhost:3001/api/documents

Project Structure

src/
├── index.ts              # Main server entry point
├── types/                # TypeScript type definitions
│   └── index.ts
├── middleware/           # Express middleware
│   └── errorHandler.ts
├── services/             # Business logic services
│   ├── documentProcessor.ts
│   ├── embeddingService.ts
│   └── qaService.ts
├── routes/               # API route handlers
│   ├── documents.ts
│   └── qa.ts
└── prisma/               # Database schema
    └── schema.prisma

Development

Available Scripts

npm run dev - Start development server with hot reload
npm run build - Build for production
npm run start - Start production server
npm run type-check - TypeScript type checking
npm run db:migrate - Run database migrations
npm run db:studio - Open Prisma Studio
npm test - Run tests

Environment Variables

Variable	Description	Default
`PORT`	Server port	`3001`
`NODE_ENV`	Environment	`development`
`DATABASE_URL`	Database connection	`file:./dev.db`
`LLAMA_MODEL_PATH`	Path to Llama model file	`./models/llama-2-7b-chat.gguf`
`LLAMA_MODEL_TYPE`	Llama model type	`llama-2-7b-chat`
`MAX_FILE_SIZE`	Max file size (bytes)	`10485760` (10MB)
`EMBEDDING_MODEL`	Embedding model	`Xenova/all-MiniLM-L6-v2`

Database Schema

The application uses Prisma with the following models:

User: User accounts (basic implementation)
Document: Uploaded documents with metadata
Chunk: Text chunks with embeddings for vector search
Usage: Usage tracking for analytics

File Processing Pipeline

Upload: File validation and storage
Extraction: Text extraction based on file type
Chunking: Intelligent text splitting with overlap
Embedding: Vector embedding generation
Storage: Database storage with relationships

Q&A Pipeline

Question: User submits question
Embedding: Generate embedding for question
Search: Vector similarity search for relevant chunks
Context: Prepare context from relevant chunks
Answer: Generate answer using local Llama model
Response: Return structured response with sources

Error Handling

The application includes comprehensive error handling:

Input validation with detailed error messages
File processing error handling
API error responses with appropriate HTTP status codes
Database error handling
Graceful server shutdown

Security

Helmet.js for security headers
CORS configuration
File type validation
File size limits
Input sanitization

Performance

Efficient text chunking with overlap
Local embedding generation (no external API calls)
Database indexing for fast queries
Memory-efficient file processing

Next Steps

This is the MVP backend. Future enhancements include:

User authentication and authorization
Rate limiting
Caching layer
Advanced vector database (Pinecone/Chroma)
Multi-document conversations
Usage analytics and billing
Admin dashboard
API documentation with Swagger

Contributing

Fork the repository
Create a feature branch
Make your changes
Add tests
Submit a pull request

License

MIT License - see LICENSE file for details

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
.cursor/rules		.cursor/rules
prisma		prisma
public		public
src		src
.gitignore		.gitignore
README.md		README.md
jest.config.js		jest.config.js
nodemon.json		nodemon.json
package.json		package.json
test-document.txt		test-document.txt
tsconfig.json		tsconfig.json
yarn.lock		yarn.lock

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Document Q&A SaaS Backend

Features

Tech Stack

Quick Start

Prerequisites

Installation

API Endpoints

Health Check

Documents

Q&A

Usage Examples

Upload a Document

Ask a Question

Get Document List

Project Structure

Development

Available Scripts

Environment Variables

Database Schema

File Processing Pipeline

Q&A Pipeline

Error Handling

Security

Performance

Next Steps

Contributing

License

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Document Q&A SaaS Backend

Features

Tech Stack

Quick Start

Prerequisites

Installation

API Endpoints

Health Check

Documents

Q&A

Usage Examples

Upload a Document

Ask a Question

Get Document List

Project Structure

Development

Available Scripts

Environment Variables

Database Schema

File Processing Pipeline

Q&A Pipeline

Error Handling

Security

Performance

Next Steps

Contributing

License

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages