本报告包括详尽完整的文本分类处理过程,包括语料库的处理、jieba分词、停用词无关词处理、词袋模型的构建(CHI值检验用于特征筛选、tfidf作为特征向量值)。
并用自编朴素贝叶斯以及sklearn包中的SVM进行了文本效果的检测,通过混淆矩阵和roc曲线展现了实现效果。
实验报告写的很详细,不懂的地方可以看报告以及看博客中的部分细节讲解。
2023/7/15 21:32:55 4.05MB 数据挖掘 文本分类
Titman动量效应代码,主要是从CRSP上抓取数据来进行动量策略的检验
2023/7/15 20:23:17 25KB SAS
机器学习数据资源可用于朴素贝叶斯垃圾邮件过滤器中的一些训练文本数据集。
使用朴素贝叶斯解决一些现实生活的问题时,需要先从文本内容得到字符串列表,然后生成词向量。
其中朴素贝叶斯的一个最著名的应用:电子邮件垃圾过滤。
修改datax源码plugin-unstructured-storage-util下的UnstructuredStorageReaderUtil.class加上一个判断,因为在hdfs中,null值存储的是\N,所以需要把它转换成null存储到Mysql中
2023/7/13 0:45:01 35KB datax java \N
本资源是CSAPP配套实验二进制炸弹binarybomb的实验报告。
使用c32asm进行反编译,查看汇编代码比较方便编译调试工具使用gdb,常用命令:disassemb查看当前函数的汇编代码x/0x4061a2查看内存b函数名在函数开始处设置断点b*0x401233在一条指令处设置断点ir寄存器名查看寄存器的值
2023/7/12 9:10:21 404KB csapp binarybomb 二进制炸弹
偏最小二乘法讲解最好的书,理论推导非常仔细,里面还有我自己做的笔记,,值得下载,强烈推荐、
2023/7/12 9:06:30 4.03MB PLS LS
《神奇的矩阵——第二季》《神奇的矩阵——第二季》《神奇的矩阵——第二季》《神奇的矩阵——第二季》
2023/7/11 20:55:12 17.56MB 矩阵
数学物理方程与特殊函数(第3版)王元明
2023/7/11 16:01:15 34.62MB 数学物理方法
非线性规划贪心算法太阳能小屋最佳倾角模型sketchup软件
2023/7/11 15:14:06 3.67MB 贪心算法
基于echarts的数据分析实例
2023/7/11 4:18:34 1.47MB 数据分析
共 1000 条记录 首页 上一页 下一页 尾页