搜索【jieba】的结果-好快吧下载

中英平行语料库（八万对，句粒度）

共8400多对中英语句，已预处理，中文用jieba分了词，标点符号没问题，保存于en-zh.csv，分隔符是制表符\t（不是默认逗号）。
句粒度，但有不少长句，裁剪后5w对也够用。
原始数据集也在包中，其中en-zh_News.tmx有一部分句子有问题，（en-zh.csv丢弃了有问题的句子），如果必要建议不要直接使用该文件。
另外附赠我对语料的预处理文件（propressor.py），以及数据集（pytorch的Dataset）等相关的实现（LangData.py)。
如果又可以改善的地方，欢迎留言

2025/7/16 16:52:35 35.14MB 中英平行语料库 语料

1

jieba分词资源包

结巴分词用到的资源文件，使用方式见博客

2025/5/19 18:18:20 1.88MB jieba分词

1

中文分词词库汇总

汇总的中文分词词库，分为两个目录：1、中文分词词库汇总。
包含10个词库，文件名字表示里面词的数量（单位是千），如150.txt，表示包含15万词。
2、主流分词工具的词库。
包含word/jieba/mmseg/IK分词工具的最近词库。
注意：分词时，不一定是词库中的词越多，效果越好。

2025/1/28 7:47:49 10.34MB 中文分词 分词词库 分词词库

1

java版jieba分词统计，含1.02版本jar

结巴分词,jieba分词，统计分词出现的频率，按频率统计分词出现的频率。
分词器功能，建议参考elasticsearch的分词器，此分词器为入门级的分词拆分和分词频率统计

2025/1/24 12:33:32 6.44MB jieba分词 java 分词统计 结巴

1

jieba-analysis-1.0.2.rar

jieba分词所需要使用的jar包结巴分词的使用比较方便，效果也不错，也无需连接网络即可使用。
在项目中使用到了结巴分词，故在此保存备份。

2024/12/1 12:50:49 2.09MB jieba分词jar包

1

python爬取豆瓣每个账户对电影的评分和影评，绘制评分饼图和影评词云图

（1）打开豆瓣一部电影评论区，根据html结构捕获三个信息：一，每账号的评分等级为5星、4星、3星、2星、1星；
二，每个账号的评论留言；
三，跳转到下个评论页面的http链接（2）获取所有的信息后对信息进行处理：一，计算出每个星级的总数和一共多少账户进行了评级二、将所有的评论内容放在一起，处理评论中的空格和其他不规范形式（3）用matplotlib绘制评分等级占比的饼图，用jieba进行分词处理，用wordcloud生成词云图同个修改url=https://movie.douban.com/subject/26430636/comments?start=0&limit=20&sort=new_score&status=P&percent;_type=之中“26430636”为电影的代表，将其换做其他的编号就可以读取和生成其他电影的matplotlib和wordcloud制作评分图和词云图

2024/9/3 5:47:41 14KB python爬虫

1

基于mongodb存储的军事领域知识图谱问答项目

基于mongodb存储的军事领域知识图谱问答项目，8大类，100余小类，共计5800项的知识库，该项目不使用图数据库进行存储，通过jieba进行问句解析，问句实体项识别，基于查询模板完成多类问题的查询，主要是提供一种工业界的问答思想demo。

2024/8/23 7:48:42 3.75MB 知识图谱

1

python淘宝网指定关键词爬取商品信息和评论

python淘宝网指定关键词爬取商品信息和评论，并用jieba库进行形容词的提取

2024/3/31 15:36:53 1.03MB python

1

最新中文分词工具的词库

包括4款分词工具的最新词库：1、IK分词：27万词2、jieba分词：40万词3、mmseg分词：15万词4、word分词：64万词

2024/1/13 21:47:06 4.77MB 分词中文 中文分词 word

1

Python分词系统jieba代码（有注释，无报错）

Python分词系统jieba代码（有注释，无报错）！！！！！！！！！！！！！！！！！！！

2023/10/23 10:13:24 2KB jieba phthon 分词系统 分词

1

钉钉无人值守自动打卡脚本永不迟到的神器安卓和苹果教程 New!

在日常工作中，钉钉打卡成了我生活中不可或缺的一部分。然而，有时候这个看似简单的任务却给我带来了不少烦恼。每天早晚，我总是得牢记打开钉钉应用，点击"工作台"，再找到"考勤打卡"进行签到。有时候因为工作忙碌，会忘记打卡，导致考勤异常，影响当月的工作评价。而且，由于我使用的是苹果手机，有时候系统更新后，钉钉的某些功能会出现异常，使得打卡变得更加麻烦。另外，我的家人使用的是安卓手机，他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说，每次打卡都是一次挑战。他们总是担心自己会操作失误，导致打卡失败。为了解决这些烦恼，我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习，我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。

2024-04-09 15:03 15KB 钉钉 钉钉打卡

个人信息

一言

热门下载

最新下载

其他资源