本资源为天津大学社会信息检索的一项大作业,基于爬取的语料库,总体实现了三个功能:TFIDF计算,两句子相似度计算,基于语料库的搜索引擎。
具体任务如下:1)TFIDF:给定用自己名字命名的文件夹,请自己爬取一定数量的网页、微博形成语料集合,存入该文件夹;
在线状态下,对其中的词语进行TFIDF统计。
2)SIM:在线状态下,从网页页面输入任意两个句子,求其相似度,包括:内积,余弦及Jaccard三种度量方式;
同时,可实现对导入的文件夹语料的tfidf统计。
3)SJet:实现基于向量空间模型(VSM)的搜索引擎。
2025/12/5 0:54:57 1.59MB TFIDF 天津大学 社会信息检索 SIRC
1
1、对微博数据进行信息采集。
2、对微博数据进行文本特征项抽取。
3、对文本进行向量化。
4、采取相似度公式进行相似度计算和对比。
5、采用K均值聚类算法进行聚类。
6、结合导致微博热点话题产生的各个因素提出了一个用来计算话题热度的公式,进行热度评估。
2025/12/3 16:07:01 45KB 聚类 微博 Python 人工智能
1
使用Java语言,实现了皮尔森和余弦相似度公式,供大家参考。
2025/6/9 17:43:08 3KB 相似度 Java
1
基于社交网络的推荐系统需要的用户相似度物品相似度计算程序代码和测试代码,编程语言为python
2025/5/23 14:26:38 957KB 程序源码 python 相似度
1
java实现的文本相似度系统,使用向量空间模型以及余弦相似度距离公式,实测可以实现2篇文本的相似度计算且有一定的效果。
2025/4/17 16:06:49 46.37MB 文本相似度
1
基于相似度的社区发现分裂算法,包括GML文件的读取,相似度计算等,有实例文件可进行实验。
2024/9/7 0:52:11 21KB 社区发现 相似度 GML文件读取
1
公司名称相似度计算,公司名称相似度计算公司名称相似度计算公司名称相似度计算
2024/7/25 10:20:05 240KB 相似度计算 空间向量余弦
1
关于电影推荐算法的matlab代码实现,参考协同过滤算法过程,使用余弦相似度计算。
2024/7/4 5:28:38 2KB 推荐 matlab
1
用java实现的哈工大同义词词林相似度计算,包含工程和文档,可以用来计算两个词之间的相似度,导入Myeclipse可以直接运行
2024/7/1 15:44:16 1.27MB 哈工大 同义词词林 词语相似度
1
hownet完整版导出的关键文本文件,包括12w词语的概念,以及所有义原的上下位关系。
使用这些文件可以实现词语相似度计算。
1
共 20 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡