numpy,pandas,seaborn,matplotlib,scikit-learn,keras
Bu proje, kredi kartının kullanıldığı her yerde bulunan kredi kartı dolandırıcılık tespitini amaçlamaktadır. Bankalarda, e-commerce (e-ticaret siteleri) ve kredi kartının geçtiği her yerde karşımıza çıkabilir.
- Kredi kartı dolandırıcılık tespiti yaparak tahminde bulunmak ve tespit etmektir.
- Sınıflandırma projesidir. Makine öğrenmesi kullanılacaktır.
- v1 - v29 feature değişkenleri standardize edilmiştir.
- İşlem yapılan yer, lokasyon, site gibi değerler gizlenmiştir.
- Bizden beklenen, bu v sütunlarından önemli olanları bulup dolandırıcılığa sebep verenleri tespit etmektir.
- Veri seti, kredi kartı işlemlerini içermektedir.
- 'id' sütunu primary key'dir.
- 'v1' - 'v29' sütunları gizlenmiş feature'lardır, yani müşteriye ait herhangi bir özelliktir.
- 'amount' sütunu, ücret miktarını belirtir. 'class' sütunu ise 1 ise sahtekarlık vardır, 0 ise yoktur demektir.
Veri setini yüklemek ve ilk analizleri yapmak için pandas kütüphanesi kullanılmıştır.
Çeşitli görselleştirmeler ve istatistikler ile veri analizi yapılmıştır.
Verinin ölçeklenmiş bir şekilde geldiiği için verilerin ölçeklenmesi sağlanmıştır.
Verinin varsayılan parametrelele modellenip nasıl bir tepki verdiğine bakılmıştır.
Undersampling tekniğiyle verinin model için doğru şekle getirlimesi sağlanmıştır.
Verinin En iyi parametrelerle modellenip tekrar kurulması sağlanmıştır.
Verinin keras kütüphanesi kullanılarak tekrar modellenmesi sağlanmıştır.
Modelin çeşiti metrikler ile ölçülüp tekrar değerlendirmesi ile modelin karşılaştırılması sağlanmıştır.
Modelin derin öğrenme ile doğruluk değerinin %97 ye ulaşmıştır.logistic regression ve svc gibi modellerde daha %94 ,93 gibi değerlere ulaşmıştır. Modele en çok etki eden önemli featurların bulup çıkarılması sağlanmıştır.