Data Manager

A modular Python framework for data engineering, validation, and analytics workflows.

Data Manager provides a job-based architecture and pluggable storage backends for processing tabular datasets in a structured and extensible way.

Features

Modular storage backends (CSV, JSON, In-Memory)
Job-based execution architecture
Data engineering utilities
Data validation and schema checking
Data analytics and profiling
Fully tested with Pytest

Installation

pip install data-manager-framework

Quick Start

from data_manager.storage.csv_backend import CSVStorage
from data_manager.jobs.data_analytics import DataAnalytics

storage = CSVStorage()
storage.read("data.csv")

analytics = DataAnalytics(storage)

print(analytics.summary())

Core Components

Storage Layer

Provides interchangeable storage backends:

CSVStorage
JSONStorage
InMemoryStorage

Data Engineering

Available operations:

Remove duplicate records
Handle missing values

Data Validation

Available validations:

Schema validation
Data type checks
Nullability checks

Data Analytics

Available analytics:

Dataset summary
Column statistics
Missing value analysis
Duplicate analysis
Dataset profiling

Example Pipeline

from data_manager.storage.csv_backend import CSVStorage
from data_manager.jobs.data_engineer import DataEngineer

storage = CSVStorage()
storage.read("data.csv")

engineer = DataEngineer(storage)

engineer.removeDuplicates()
engineer.removeNull()

storage.write("cleaned_data.csv")

Testing

Run the complete test suite:

pytest

Verbose mode:

pytest -v

Current Capabilities

Component	Features
Storage	CSV, JSON, In-Memory
Engineering	Remove duplicates, Handle missing values
Validation	Schema validation, Nullability checks
Analytics	Summary, Profiling, Missing value analysis, Column statistics

Name		Name	Last commit message	Last commit date
Latest commit History 29 Commits
Docs		Docs
Notebooks		Notebooks
examples		examples
src/data_manager		src/data_manager
tests		tests
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
conftest.py		conftest.py
pyproject.toml		pyproject.toml
pytest.ini		pytest.ini
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Data Manager

Features

Installation

Quick Start

Core Components

Storage Layer

Data Engineering

Data Validation

Data Analytics

Example Pipeline

Testing

Current Capabilities

Roadmap

License

Author

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Data Manager

Features

Installation

Quick Start

Core Components

Storage Layer

Data Engineering

Data Validation

Data Analytics

Example Pipeline

Testing

Current Capabilities

Roadmap

License

Author

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages