Setup

Environment

pip install uv
uv sync

Data Preparation

Nothing to do. This is because in train.py:get_streaming_dataset we implement a default setting of loading streaming dataset from DKYoon/SlimPajama-6B.

Training

bash train.sh arm_700m # bdm_700m, mdm_700m, udm_700m

Evaluation Harness

To evaluate a model, set the MODEL_PATH environment variable to your checkpoint directory and run eval.sh. IMPORTANT: The script detects the model architecture from the folder name.

# Example for an AR model
MODEL_PATH=ar_700m/checkpoint-500 bash eval.sh

# Example for a Masked Diffusion model
MODEL_PATH=mdm_700m/checkpoint-1000 bash eval.sh

Acknowledgments

Thanks lm-eval and LLaDA for their great work!

Name		Name	Last commit message	Last commit date
Latest commit History 35 Commits
.vscode		.vscode
configs		configs
models		models
skills/vscode-debug-launch		skills/vscode-debug-launch
.gitignore		.gitignore
.python-version		.python-version
README.md		README.md
ds_config.json		ds_config.json
eval.sh		eval.sh
eval_bdm.py		eval_bdm.py
eval_mdm.py		eval_mdm.py
eval_udm.py		eval_udm.py
generate.py		generate.py
kill_training.sh		kill_training.sh
launch_debug.sh		launch_debug.sh
noise.py		noise.py
pyproject.toml		pyproject.toml
report.md		report.md
requirements.txt		requirements.txt
test.py		test.py
train.py		train.py
train.sh		train.sh
uv.lock		uv.lock
vista_train.sh		vista_train.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Setup

Environment

Data Preparation

Training

Evaluation Harness

Acknowledgments

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Setup

Environment

Data Preparation

Training

Evaluation Harness

Acknowledgments

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages