上传者: sgfmby1994
|
上传时间:2023/7/15 21:32:55
|
文件大小:4.05MB
|
文件类型:pdf
文本分类实验报告(详尽版本)
本报告包括详尽完整的文本分类处理过程,包括语料库的处理、jieba分词、停用词无关词处理、词袋模型的构建(CHI值检验用于特征筛选、tfidf作为特征向量值)。
并用自编朴素贝叶斯以及sklearn包中的SVM进行了文本效果的检测,通过混淆矩阵和roc曲线展现了实现效果。
实验报告写的很详细,不懂的地方可以看报告以及看博客中的部分细节讲解。
本软件ID:10911977