Transformers

Minimal PyTorch implementation of the Transformers architecture from Vaswani et al.'s 2017 paper, Attention Is All You Need. This repository serves as a deep dive into understanding key architectures and their nuances, including architecture design and training techniques.

Components

Project Structure

Tokenizer.py
Modules/
- Attention.py
  - MultiHeadAttentionBase
  - MultiHeadSelfAttention
  - MultiHeadCrossAttention
- AddNorm.py
- MLP.py
- Encoder.py
  - EncoderLayer
  - Encoder
- Decoder.py
  - DecoderLayer
  - Decoder
- Transformer.py
  - Transformer
Config/
- Config.py
BERT/
- BERT.py
  - Bert

Name		Name	Last commit message	Last commit date
Latest commit History 14 Commits
BERT		BERT
config		config
modules		modules
.gitignore		.gitignore
Dataset.py		Dataset.py
README.md		README.md
Tokenizer.py		Tokenizer.py
Trainer.py		Trainer.py
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Transformers

Components

Project Structure

About

Uh oh!

Languages

yonas-g/Transformer

Folders and files

Latest commit

History

Repository files navigation

Transformers

Components

Project Structure

About

Resources

Uh oh!

Stars

Watchers

Forks

Languages