Skip to content

yangcd-bupt/spam

Repository files navigation

spam

sklearn实现中文垃圾邮件分类
训练效果
img

说明

spam.zip中是原始数据,train文件中是分词并分类的文件
test中是要预测分类的邮件,也已分词
result.txt是预测结果
ps:原始数据中的文本格式不统一,分词时折磨了我好久,需要判别文本格式再统一转为utf-8才能分词

About

sklearn实现中文垃圾邮件分类

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages