本文通过对文本人物关系、文本结构分层、作者行文风格的分析来分析中文文本。
针对问题一,我们运用聚类分析和层次分析建立模型从物理结构与逻辑结构两方面来分析文本,我们提取文本中和文本标题中的人名作为特征项,用matlab编程分别统计每个人名在各个段落中的频数。
通过运用主成分分析法对文本进行的分析我们得出自变量与常数项几乎不相关,因而不需要采取主成分回归分析。
通过系统聚类分析,我们得到了聚类图,从中得出了主演人物之间的关系。
通过层次划分,我们将样本一划分为两层,样本二划分为两层,样本三划分为两层。
最后通过matlab编程统计样本中虚词的频数,并且分别对样本中虚词总体和各个虚词进行统计,运用计算风格学理论,我们得出前八十回与后四十回作者的行文风格存在差异。
针对问题二,我们对聚类分析、层次划分、行文风格进行了检验。
对于聚类分析的结果,我们与从对文本概述的文学概括分析得到的人物关系进行比较检验,验证了聚类分析结果是可靠性。
对于层次分析,我们通过用Excel对数据做出折线图,对图形进行分析,得出与用层次分析算法得出的相同的人物关系结论。
针对问题三,我们计算了各个样本中主要人物的比重,做出了折线图,从图中我们得出了文本结构一致性的结论,体现了三个样本的相同性。
通过计算同一个人物在不同样本中的频数(以黛玉为例),我们得出各个样本由于主题思想的不同主要人物也有差异。
2022/9/6 19:12:32 1.45MB 数学建模
1
机械学习课程附带的程序练习,有很多简单的基础程序可供练习参考,自带鸢尾花数据等database
2022/9/6 7:24:18 13.79MB 机器学习 data modeling pca降维
1
顶点成分分析算法是一种非监督的端元提取算法。
顶点成分分析法假设纯净像元存在,根据凸面几何原理,认为端元都位于单形体的顶点。
VCA算法通过将数据投影到一个正交的子空间方向计算投影距离值最大的像元,它就是要寻找的端元。
要不断进行迭代计算,直到所有的端元都被找到。
VCA的计算步骤为:①对图像数据进行降维处理,设定一个信噪比门限值SNRth,根据图像的信噪比与门限值对比大小分别采用主成分分析法(PCA)或者奇异值分解法(SVD)对图像数据进行降维;②利用随机生成的正态分布矩阵计算初始向量,将所有的像元点向初始向量方向投影,找到投影值最大的作为端元;③继续计算新的投影向量方向并进行迭代计算直到找出所有的端元,本资源实现了VCA算法来非监督提取端元,希望对研讨端元提取的朋友有用
2022/9/4 20:45:10 9.29MB 端元提取算法论文及代码
1
本研究回顾了基于主成分分析PCA和判别分析LDA的降维方法及其扩展,包括经典主成分分析、概率主成分分析、核主成分分析,以及线性判别分析、局部保持降维、图形嵌入判别分析和半监督降维分析。
2022/9/4 7:32:06 1020KB PCA LDA 高光谱降维
1
PLS-toolbox偏最小二乘回归、主成分分析注册码,只要改了机器时间,可以不断使用,这是9月份的,需要改为9月份注册。
2022/9/4 1:28:36 47.26MB PLS-toolbox 偏最小二乘回归
1
利用Matlab编程完成主成分分析内附代码和讲解
2022/9/3 15:40:06 145KB Matlab编程 主成分分析
1
特征脸方法是从主成分分析(PCA)导出的一种人脸识别和描述技术。
它将包含人脸的图像区域看作一随机向量,采用K-L变换得到正交K-L基,对应其中较大特征值的基具有与人脸相似的形状,因而又被称为特征脸。
利用这些基的线性组合可以描述、表达和逼近人脸图像,所以可进行人脸识别与合成。
识别过程就是将人脸图像映射到由特征脸组成的子空间上,并比较其在特征脸空间中的位置,然后利用对图像的这种投影间的某种度量来确定图像间的相似度,最常见的就是选择各种距离函数来进行度量分类实现人脸识别。
2015/9/9 18:58:16 2.55MB 数学建模
1
(含源码及报告)本程序分析了自2016年到2021年(外加)每年我国原油加工的产量,并且分析了2020年全国各地区原油加工量等,含饼状图,柱状图,折线图,数据在地图上显示。
运转本程序需要requests、bs4、csv、pandas、matplotlib、pyecharts库的支持,如果缺少某库请自行安装后再运转。
文件含6个excel表,若干个csv文件以及一个名字为render的html文件(需要用浏览器打开),直观的数据处理部分是图片以及html文件,可在地图中显示,数据处理的是excel文件。
不懂可以扫文件中二维码在QQ里面问。
2022/9/30 16:31:44 29.75MB 爬虫 python 源码软件 开发语言
1
本资源是斯坦福ML公开课笔记的13-15部分。
次要内容包括混合高斯模型、混合贝叶斯模型、因子分析模型、主成分分析、奇异值分解、隐含语义索引和独立成分分析等内容。
欢迎下载
2015/6/26 19:42:55 1.33MB 机器学习 斯坦福公开课 笔记
1
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡