Repository ini adalah komponen penyiapan data intent untuk proyek SentinelAI — AI Emergency Assistant. Fokusnya bukan chatbot end-to-end, tetapi menghasilkan dataset training yang dipakai pada tahap Intent Classification (NLP Model) di alur:
flowchart LR
A[User Input] --> B[Text Preprocessing]
B --> C[Intent Classification]
C --> D[Intent Mapping]
D --> E[Response Generator]
Dataset yang dihasilkan berisi pasangan
textdanintentuntuk skenario tanggap bencana.
Intent awal (MVP) yang tersedia saat ini:
earthquake_helpflood_helpfire_helpevacuation_locationfirst_aidgeneral_chit_chat
src/data/taxonomy.py: sumber utterance per intentsrc/data/generator.py: mengubah taxonomy menjadi dataset flatsrc/data/cli.py: antarmuka CLI untuk generate datasetmain.py: entry point eksekusi proyek
python main.py --outdir ./datasets --filename final_dataset.jsonGenerator membuat file JSON berformat list objek:
[
{"text": "ada gempa bumi besar", "intent": "earthquake_help"},
{"text": "tolong rumah kebanjiran", "intent": "flood_help"}
]- Direktori output akan dibuat otomatis jika belum ada.
- Menambah data intent dilakukan dari
src/data/taxonomy.py, lalu generate ulang file JSON.
Proyek ini menggunakan lisensi MIT. Lihat file LICENSE untuk detail lengkap.