最大概率分词算法,带详细源码基于最大概率的汉语切分目标:采用最大概率法进行汉语切分。
其中:n-gram用bigram,平滑方法至少用Laplace平滑。
输入:接收一个文本,文本名称为:corpus_for_test.txt输出:切分结果文本,其中:切分表示:用一个字节的空格“”分隔,如:我们在学习。
每个标点符号都单算一个切分单元。
输出文件名为:学号.txt
2024/1/27 18:42:02 220KB 分词 算法
1
1.实验内容每一个正规集都可以由一个状态数最少的DFA所识别,这个DFA是唯一的(不考虑同构的情况)。
任意给定的一个DFA,根据以下算法设计一个C程序,将该DFA化简为与之等价的最简DFA。
2.实验设计分析2.1实验设计思路根据实验指导书和书本上的相关知识,实现算法。
2.2实验算法(1)构造具有两个组的状态集合的初始划分I:接受状态组F和非接受状态组Non-F。
(2)对I采用下面所述的过程来构造新的划分I-new.ForI中每个组GdoBegin当且仅当对任意输入符号a,状态s和读入a后转换到I的同一组中;
/*最坏情况下,一个状态就可能成为一个组*/用所有新形成的小组集代替I-new中的G;end(3)如果I-new=I,令I-final=I,再执行第(4)步,否则令I=I=new,重复步骤(2)。
(4)在划分I-final的每个状态组中选一个状态作为该组的代表。
这些代表构成了化简后的DFA M'状态。
令s是一个代表状态,而且假设:在DFAM中,输入为a时有从s到t转换。
令t所在组的代表是r,那么在M’中有一个从s到r的转换,标记为a。
令包含s0的状态组的代表是M’的开始状态,并令M’的接受状态是那些属于F的状态所在组的代表。
注意,I-final的每个组或者仅含F中的状态,或者不含F中的状态。
(5)如果M’含有死状态(即一个对所有输入符号都有刀自身的转换的非接受状态d),则从M’中去掉它;
删除从开始状态不可到达的状态;
取消从任何其他状态到死状态的转换。






2024/1/27 6:58:27 1KB DFA化简 C++ 编译原理
1
评论后,你的1分还你。
本软件可以将中文,字母,数字,特殊符号,转化为16进制字符,格式可选。
如程序中需要转换大量字符为16进制,可应用本软件转化。
本程序仅为初版,欢迎各位提供改善建议。
2024/1/25 23:46:11 7KB 字符 转化
1
应该算是比较齐全的了,中文英文标点符号特殊符号基本上的都有包括
2024/1/24 14:54:30 10KB 停用词 stopword stopwords
1
适用于Oh-my-PoshV3的字体,可以解决使用Cascadia字体导致的powerline部分符号无法显示出现方框、乱码的情况。
2024/1/24 5:43:03 63.8MB 字体 WindowsFonts NerdFonts 书呆子字体
1
正交频分复用技术中用最大似然函数法联合实现符号定时同步和载波同步。
2024/1/23 21:06:58 3KB OFDM 同步 最大似然函数法
1
北京市最新shape数据各种图层应有尽有,居民点、铁路、水系、餐厅、银行、相当于离线百度高德地图,图层符号注记都已经配好
2024/1/22 23:15:20 33.73MB 北京市 shapefile 数据
1
汇编从键盘输入两个有符号数字加减乘除后输出结果
2024/1/16 14:56:56 4KB 汇编 加减乘除 两个有符号数字
1
二调地图ARCGIS符号库.rar
2024/1/14 0:35:17 26KB 二调地图ARCGIS符号库
1
android自定义全键盘随机(包含字母+标点符号+数字),可以自适应所以手机系统,有需要的赶紧下载。
2024/1/6 9:06:58 32KB 自定义键盘
1
共 547 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡