四川大学编译道理2011-2015年期末考题,期末刷题必备。
2023/2/19 20:55:02 1.67MB 编译原理期末
1
配套于2011年上海交大新版教材,主教提供,不定期更新。
2023/2/15 19:53:06 179KB 张跃辉 上海交大 矩阵理论与应用
1
文本挖掘tmSVM开源项目集成libSVM和liblinear包含Python和Java两种版本带PDF源码参考文档简介文本挖掘无论在学术界还是在工业界都有很广泛的应用场景。
而文本分类是文本挖掘中一个非常重要的手段与技术。
现有的分类技术都已经非常成熟,SVM、KNN、DecisionTree、AN、NB在不同的应用中都展示出较好的效果,前人也在将这些分类算法应用于文本分类中做出许多出色的工作。
但在实际的商业应用中,仍然有很多问题没有很好的解决,比如文本分类中的高维性和稀疏性、类别的不平衡、小样本的训练、Unlabeled样本的有效利用、如何选择最佳的训练样本等。
这些问题都将导致curveofdimension、过拟合等问题。
这个开源系统的目的是集众人智慧,将文本挖掘、文本分类前沿领域效果非常好的算法实现并有效组织,形成一条完整系统将文本挖掘尤其是文本分类的过程自动化。
该系统提供了Python和Java两种版本。
主要特征该系统在封装libsvm、liblinear的基础上,又增加了特征选择、LSA特征抽取、SVM模型参数选择、libsvm格式转化模块以及一些实用的工具。
其主要特征如下:封装并完全兼容*libsvm、liblinear。
基于Chi*的featureselection见feature_selection基于LatentSemanticAnalysis的featureextraction见feature_extraction支持Binary,Tf,log(tf),Tf*Idf,tf*rf,tf*chi等多种特征权重见feature_weight文本特征向量的归一化见Normalization利用交叉验证对SVM模型参数自动选择。
见SVM_model_selection支持macro-average、micro-average、F-measure、Recall、Precision、Accuracy等多种评价指标见evaluation_measure支持多个SVM模型同时进行模型预测采用python的csc_matrix支持存储大稀疏矩阵。
引入第三方分词工具自动进行分词将文本直接转化为libsvm、liblinear所支持的格式。
使用该系统可以做什么对文本自动做SVM模型的训练。
包括Libsvm、Liblinear包的选择,分词,词典生成,特征选择,SVM参数的选优,SVM模型的训练等都可以一步完成。
利用生成的模型对未知文本做预测。
并返回预测的标签以及该类的隶属度分数。
可自动识别libsvm和liblinear的模型。
自动分析预测结果,评判模型效果。
计算预测结果的F值、召回率、准确率、Macro,Micro等指标,并会计算特定阈值、以及指定区间所有阈值下的相应指标。
分词。
对文本利用mmseg算法对文本进行分词。
特征选择。
对文本进行特征选择,选择最具代表性的词。
SVM参数的选择。
利用交叉验证方法对SVM模型的参数进行识别,可以指定搜索范围,大于大数据,会自动选择子集做粗粒度的搜索,然后再用全量数据做细粒度的搜索,直到找到最优的参数。
对libsvm会选择c,g(gamma),对与liblinear会选择c。
对文本直接生成libsvm、liblinear的输入格式。
libsvm、liblinear以及其他诸如weka等数据挖掘软件都要求数据是具有向量格式,使用该系统可以生成这种格式:labelindex:valueSVM模型训练。
利用libsvm、liblinear对模型进行训练。
利用LSA对进行FeatureExtraction*,从而提高分类效果。
开始使用QuickStart里面提供了方便的使用指导如何使用该系统可以在命令行(Linux或cmd中)中直接使用,也可以在程序通过直接调用源程序使用。
在程序中使用。
#将TMSVM系统的路径加入到Python搜索路径中importsyssys.path.insert(0,yourPath+"\tmsvm\src")importtms#对data文件夹下的binary_seged.train文件进行训练。
tms.tms_train(“../data/binary_seged.train”)#利用已经训练好的模型,对对data文件夹下的binary_seged.test文件预测tms.tms_predict(“../data/binary_seged.test”,”../model/tms.config”)#对预测的结果进行分析,评判模型的效果tms.tms_analysis(“../tms.result”)在命令行中调用#对data文件夹下的binary_seged.train文件进行训练。
$pythonauto_train.py[options]../data/binary_seged.train#利用已经训练好的模型,对对data文件夹下的binary_seged.test文件预测pythonpredict.py../data/binary_seged.train../model/tms.config#对预测的结果进行分析,评判模型的效果$pythonresult_anlaysis.py../tms.result上面的调用方式都是使用系统中默认的参数,更具体、灵活的参数见程序调用接口输入格式labelvalue1[value2]其中label是定义的类标签,如果是binaryclassification,建议positive样本为1,negative样本为-1。
如果为multi-classification。
label可以是任意的整数。
其中value为文本内容。
label和value以及value1和value2之间需要用特殊字符进行分割,如”\t”模型输出模型结果会放在指定保存路径下的“model”文件夹中,里面有3个文件,默认情况下为dic.key、tms.model和tms.config。
其中dic.key为特征选择后的词典;
tms.model为训练好的SVM分类模型;tms.config为模型的配置文件,里面记录了模型训练时使用的参数。
临时文件会放在“temp”文件夹中。
里面有两个文件:tms.param和tms.train。
其中tms.param为SVM模型参数选择时所实验的参数。
tms.train是供libsvm和liblinear训练器所使用的输入格式。
源程序说明src:即该系统的源代码,提供了5个可以在Linux下可以直接调用的程序:auto_train.py、train.py、predict.py为在Linux下通过命令行调用的接口。
tms.py为在程序中调用的主文件,直接通过importtms即可调用系统的所有函数。
其他文件为程序中实现各个功能的文件。
lsa_src:LSA模型的源程序。
dependence:系统所依赖的一些包。
包括libsvm、liblinear、Pymmseg在Linux32位和64位以及windows下的支持包(dll,so文件)。
tools:提供的一些有用的工具,包括result_analysis.py等。
java:java版本的模型预测程序,项目重要更新日志2012/09/21针对linux下的bug进行修正。
重新生成win和linux版本的。
2012/03/08增加stem模块,并修正了几个Bug。
2011/11/22tmsvm正式发布。
联系方式邮箱:zhzhl202@163.comThanks本系统引用了libsvm、liblinear的包,非常感谢Chih-JenLin写出这么优秀的软件。
本系统还引用了Pymmseg,非常感谢pluskid能为mmseg写出Python下可以直接使用的程序从最初的想法萌生到第一版上线,中间试验了很多算法,最终因为效果不好删掉了很多代码,在这期间得到了许多人的帮助,非常感谢杨铮、江洋、敏知、施平等人的悉心指导。
特别感谢丽红一直以来的默默支持。
2023/2/8 18:37:14 3.39MB 文本挖掘 tmSVM libSVM 支持向量机
1
百络网警》校园版2011集中监控和管理校园内所有电脑,它只须安装在一台电脑上,即可对校园网内所有电脑全面监控和管理,它有对色情和反动内容的超强过滤能力,一切对不良内容的访问都被详细记录,无处可藏,它将使您能全面开放校园网和互联网的连接,让您永无后顾之忧。
是一套真正高效、方便、实用的高质量局域网管理软件。
局域网管理软件功能简介:全方位阻挡色情和反动网上资讯对学生的毒害集中监控校园内所有上网电脑可分别对不同网络协议进行控制和管理实时监控学生网上行为系统自带色情、游戏、聊天、证券股票等网址库(网址库自动升级)可自定义设置需要阻挡或不准搜索的关键词还可自定义添加不准浏览的网址可根据需要设置上网内容和控制上网时间可灵活设置每台电脑的上网时间和上网流量可对每台电脑进行端口控制可对QQ、ICQ、MSN、和线游戏等进行控制设置机器或组别在不同的时间段使用不同的上网模式(正常上网、过滤上网、指定上网、不准上网)可将电脑分为若干网络教室或组别,并可对不同的组别进行个性化管理可查询整个网络中浏览不良信息的全部详细记录可提供每台电脑详细的上网记录和方便的统计分析可统计分析每台电脑的上网时间和上网流量过滤色情、暴力、反动等不良站点,每周自动升级一次过滤游戏、聊天、证券等娱乐站点,每周自动升级一次禁止使用各大搜索引擎,以及登陆部分门户网站按时间顺序记录每台电脑的所有网络行为,如:IP、时间、协议、端口以及文件名和文件大小监控每台电脑的上传下载,BBS、博客、论坛发贴和外发文件;
监控ARP攻击和网络欺骗行为所有上网日志可以设置保存时间和修改保存路径,也可以另存和排序打印所有上网日志都可以按IP、机器名、MAC地址、时间、组、服务类型和关键字进行分类查询对邮件和论坛内容、访问站点、QQ、MSN等日志分类查询查询热门网站排行榜、上网时间、上网流量统计各组或者每台电脑的上网字节数和整个网络的总流量可以按时间或者组统计查询整个网络的上网行为和内容可以将机器按IP或者VLAN分成不同的组,可以增添和删除组可对各组不同时间段采用不同的上网模式和控制方式来进行管理可将整个软件的设置信息导出另存,方便以后安装就不用再设置可建立多个用户对软件进行远程管理,不同的用户分配不同的管理权限
2023/2/6 20:43:25 8.35MB 网络 安全 监控 局域网
1
本程序用于全国大先生电子设计竞赛,成功使用电流电压双环PI控制完成并联buck
2023/2/6 17:26:43 8.41MB BUCK PID 并联 STM
1
本程序使用Python2.7+PyQt4编写,可用于QQ游戏的pkg资源包解密,提取pkg资源包内的图片资源。
文件列表:PKGDecodeTool.ui:使用QtDesigner(Qt设计师)生成的界面描述文件PKGDecodeTool_ui.py:pyuic4生成的python界面代码文件PKGDecodeTool.py:主程序python逻辑处理代码文件PKGDecodeTool.exe:PKG资源包解密工具主程序,使用pyinstaller-1.5.1打包。
MIF2BMP.7z:网上一位兄弟所写的将QQ资源里面的*.mif文件转换为*.bmp的程序,没有源代码,程序里面没有用到,仅提供参考。
mif2png.zip:作者同上,将QQ资源里面的*.mif文件转换为*.png的程序,没有源代码,程序里面没有用到,仅提供参考。
QQ游戏pkg资源包存放路径示例:D:\ProgramFiles\腾讯游戏\QQGAME\hlddzSDK\data\hlddz.pkg(QQ游戏2011欢乐斗地主)声明:程序所提取的QQ游戏资源图片的版权依法为腾迅公司所有,只供个人学习研究使用,勿用于非法用途,否则后果自傲。
2023/2/4 14:46:24 9.46MB QQ游戏 图片解密 图片提取
1
2011年新年祝福源码,制造自己的新年祝福网页,上传到空间即可。
2023/1/18 10:11:27 3.34MB 2011年新年祝福源码
1
房价问题预测数学模型(西工大2011建模处理方案)
2023/1/15 3:37:22 4.37MB 房价问题 数学建模 西工大 2011
1
音频分析软件10.0正式版更新日期:2010-6-10*优化双音多频DTMF(DualTONeMulTI-Frequency)信令算法,界面增加结果倒出功能*改善对不同音频采样率兼容性问题音频分析软件10.02正式版更新日期:2010-11-10*由FFT算法改换成Goertzel算法,实现更快更精准的解码效果*改善winowsXP系统兼容性问题音频分析软件10.03正式版更新日期:2011-2-15*优化Goertzel算法,提示软件精确性*提高软件在DTMF按键音失真下的精确性音频分析软件10.04正式版更新日期:2011-5-20
2018/6/14 14:03:11 1.87MB 音频分析软件
1
2011年湖南大学3049暗码学考博真题2011年湖南大学3049暗码学考博真题
2018/6/16 7:24:32 10.58MB 湖南大学 2011 密码学 考博真题
1
共 277 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡