自己用来训练word2vec的,已提取文本,做了分词处理,过滤了大部分的特殊字符。
共包含3273626个段落的文本(一个段落包含了多个语句)。
处理后的语料有1.1G,由于文件较大,提供百度网盘下载地址。
2024/5/19 17:09:13 650B 维基 中文语料 word2vec
1
语义媒体维基语义链接到MediaWiki(又名SMW)是一个免费,开源的扩展-维基软件,维基百科的权力-让你的维基页面中存储和查询数据。
语义MediaWiki也是成熟的框架,结合了许多衍生产品扩展,可以将Wiki转变为功能强大且灵活的知识管理系统。
SMW中创建的所有数据都可以通过轻松发布,从而允许其他系统无缝使用此数据。
为了更好地了解SemanticMediaWiki的工作原理,请查看以及,视频,或者浏览以获得更全面的介绍。
要求PHP7.0至PHP7.4MediaWiki1.31至1.35MySQL5+,SQLite3+或PostgreSQL9.
2024/4/12 2:52:06 4.86MB semantic query database wiki
1
Python爬百度百科爬虫Demo
2024/3/18 17:15:50 1KB python
1
虚幻4官网wiki百科的翻译文档,有链接,更方便查看
2024/3/1 6:53:05 226KB 虚幻4,教程
1
Tera唯一纯POW分片成功的币种
2024/2/14 17:52:56 138KB Tera 比特币 区块链
1
上次传的有点问题,现重新上传OpenCL規範1.2中文正體版beta1經過對context的艱苦學習,終於略有小成,也為了兌現我之前的承諾,現將1.2發出進行公測目前已知問題:1.幾個插圖還未做,正在學習metapost2.附錄的標題編號以及附錄中的交叉引用還有點問3.没有封皮個人blog:https://niqingliang2003.wordpress.com/Email:niqingliang2003@tom.com歡迎大家提意見,包括但不限於排版和內容。
雖然我已盡己所能查閱資料,以確保其準確性,主要參考資料為維基百科,肯定仍然存在很多問題,請大家發郵件或在blog留言告知,不勝感激。
不過總的來講,就排版而言,比word的好多了,至少我是這麼認為的,大家可以對照原來1.0的比較一下。
2024/2/4 7:44:30 1.81MB OpenCL 1.2 规范 中文
1
python爬取百度百科的页面主要用BeautifulSoup,urllib2等
2024/1/27 7:11:22 9KB python
1
中文维基百科语料库,将其转换为文本文件后,进行繁体字转换为简体字,字符集转换,分词,然后训练得到模型以及向量。
由于文件上传的大小限制是60MB,我这里的压缩包中有model,然后对向量提供了下载链接。
使用python中的gensim包进行训练得到的,运行时间较长,希望对你们有帮助。
2024/1/26 7:53:54 15.2MB word2vec
1
这篇文档就是解密百度百科之“作品”创建的那些不为人知的问题,并且我将抛开各种繁琐的“大道理”和“无用的知识点”,通过简单直接的“核心秘密”让大家看完后很快就能轻松的创建各种类型的百度百科作品词条,从此以后不用再花钱求别人了。
2023/12/19 12:28:31 2.13MB 百度百科 百科词条 词条创建 网络营销
1
——–Facebook、Twitter及Quora用户增长团队的产品大牛AndyJohns倾情奉献纯干货———提要:千万不要将所有建议照单全收,做出一个四不像网站。
你应该将此看作测试网站的技巧工具箱,了解对你的产品与用户而言使用这些技巧的优点与缺点何在,以及如何使它们符合你的宏观产品愿景。
“优化注册转化率”这个话题可以扯出一本百科全书的篇幅来。
因此我会花大量笔墨来阐述。
在此先提醒你们,这将是一篇长文。

我认为优化注册转化率的方法概括起来主要就是两大类:第一大类,站内优化。
包括网页设计/文案/布局等。
这是个值得深入探讨的话题,这也是后
2023/12/18 3:36:26 816KB 如何优化网页转化率?
1
共 95 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡