本文通过对文本人物关系、文本结构分层、作者行文风格的分析来分析中文文本。
针对问题一,我们运用聚类分析和层次分析建立模型从物理结构与逻辑结构两方面来分析文本,我们提取文本中和文本标题中的人名作为特征项,用matlab编程分别统计每个人名在各个段落中的频数。
通过运用主成分分析法对文本进行的分析我们得出自变量与常数项几乎不相关,因而不需要采取主成分回归分析。
通过系统聚类分析,我们得到了聚类图,从中得出了主演人物之间的关系。
通过层次划分,我们将样本一划分为两层,样本二划分为两层,样本三划分为两层。
最后通过matlab编程统计样本中虚词的频数,并且分别对样本中虚词总体和各个虚词进行统计,运用计算风格学理论,我们得出前八十回与后四十回作者的行文风格存在差异。
针对问题二,我们对聚类分析、层次划分、行文风格进行了检验。
对于聚类分析的结果,我们与从对文本概述的文学概括分析得到的人物关系进行比较检验,验证了聚类分析结果是可靠性。
对于层次分析,我们通过用Excel对数据做出折线图,对图形进行分析,得出与用层次分析算法得出的相同的人物关系结论。
针对问题三,我们计算了各个样本中主要人物的比重,做出了折线图,从图中我们得出了文本结构一致性的结论,体现了三个样本的相同性。
通过计算同一个人物在不同样本中的频数(以黛玉为例),我们得出各个样本由于主题思想的不同主要人物也有差异。
2022/9/6 19:12:32 1.45MB 数学建模
1
现有算法对于笔画中含有大量离散笔画点和附加部分的手写体文本,分割功能较低。
针对该问题,提出一种基于分段式前景涂抹和背景细化的文本行分割算法。
对前景部分实施分段式涂抹,并删除长宽比不满足条件的膨胀区域,以获得文本区域的定位,利用图像背景的细化获取文本行分割线,给出重心判定算法,从而解决上下文本行之间的文字重叠问题。
对210幅图片、2563个文本行进行实验,结果表明,该算法的出错率仅为3.3%,低于水平投影算法、分段式投影算法和聚类算法,能对文本行进行较为完整的分割。
1
图像分割python实古代码,运用到了最小生成树、聚类等技术
2022/9/6 2:51:12 14.09MB 图像分割 python 最小生成树
1
运用python代码进行模糊聚类步骤如下:建立数据矩阵;
数据标准化;
建立模糊类似矩阵;
改造类似关系为等价关系;
确定分类数
2022/9/5 20:16:57 10KB 模糊聚类 python
1
Mean-shiftMATLABcode.简单易用。
当前比较盛行的聚类方法
2022/9/5 17:45:35 3KB Mean-shift Clustering
1
根据矩阵计较聚类中心并分类,再计较聚类中心,迭代出最终结果
2022/9/5 14:12:50 686B 动态聚类 截矩阵
1
MATLAB对象箱大全-聚类分析对象箱FuzzyClusteringToolbox
2022/9/5 7:20:48 2.01MB FuzzyClustering 聚类分析 MATLAB
1
isodata算法C言语程序,可以进行BMP图片和数字的聚类
2022/9/5 6:20:13 1.88MB ISODATA
1
获得数据集anchorbox的巨细
2022/9/4 19:44:33 8KB kmeans算法
1
FCM是基本聚类算法,经过验证,此算法很很好的运转。
对于初学聚类者来说,此算法很有用
2022/9/4 12:04:45 1.84MB FCM 聚类算法 纹理分割
1
共 547 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡