spam sklearn实现中文垃圾邮件分类 训练效果 说明 spam.zip中是原始数据,train文件中是分词并分类的文件 test中是要预测分类的邮件,也已分词 result.txt是预测结果 ps:原始数据中的文本格式不统一,分词时折磨了我好久,需要判别文本格式再统一转为utf-8才能分词