基于贝叶斯分类的中文垃圾信息分类识别核心核心代码,可直接运行的源程序。
publicvoidloadTrainingDataChinies(FiletrainingDataFile,StringinfoType){//加载中文分词其NLPIR.init("lib");//System.out.println(trainingDataFile.isFile()+"==============");//尝试加载学习数据文件try{//针对学习数据文件构建缓存的字符流,利用其可以采用行的方式读取学习数据BufferedReaderfileReader=newBufferedReader(newFileReader(trainingDataFile));//定义按照行的方式读取学习数据的临时变量Stringdata="";//循环读取学习文件中的数据while((data=fileReader.readLine())!=null){//System.out.println("*****************************");//System.out.println(data+"000000000000000000000");//按照格式分割字符串,将会分割成两部分,第一部分为ham或spam,用于说明本行数据是有效消息还是垃圾消息,第二部分为消息体本身//String[]datas=data.split(":");//对消息体本身进行简单分词(本学习数据均为英文数据,因此可以利用空格进行自然分词,但是直接用空格分割还是有些简单粗暴,因为没有处理标点符号,大家可以对其进行扩展,先用正则表达式处理标点符号后再进行分词,也可以扩展加入中文的分词功能)//首先进行中文分词//System.out.println(datas[1]+"------------------------");//if(datas.length>1){//System.out.println(datas.length);Stringtemp=NLPIR.paragraphProcess(data,0);//System.out.println(temp);String[]words=temp.split("");
2025/8/1 3:41:15 14KB 垃圾信息 文本分类 贝叶斯
1

本例中敏感词ciku.txt放在C盘根目录下,采用的ActiveXObject插件获取本地文件内容。
使用此插件不需网上下插件,直接用如下js代码即可。
浏览器需修改interner安全选项的级别,启用ActiveX才能获取到代码中的ActiveXObject插件。
如下图所示:js代码实现如下:[removed] // -------------- 全局变量,用来判断文本域中是否包含脏词,默认为false,即不包含脏词------- var isDirty = false; //使用ActiveX读取本地文件获取dirt在JavaScript中,有时我们需要在用户提交表单时检查输入内容是否包含敏感词,以防止不当内容的发布。
本文介绍了一种使用ActiveXObject技术在IE浏览器中实现这一功能的方法。
ActiveXObject是Internet Explorer特有的,它允许JavaScript与本地操作系统交互,如读取本地文件。
我们需要在本地(例如C盘根目录)创建一个名为`ciku.txt`的文本文件,其中包含了我们定义的敏感词。
然后,通过JavaScript的ActiveXObject来读取这个文件的内容。
以下是关键的JavaScript代码:```javascriptvar isDirty = false;function readFile() { var fso = new ActiveXObject("Scripting.FileSystemObject"); var openF = fso.OpenTextFile("c:\\ciku.txt", 1); var cikuStr = openF.ReadAll(); return cikuStr;}````readFile()`函数使用`Scripting.FileSystemObject`对象打开并读取`ciku.txt`文件,然后将敏感词返回给其他函数处理。
当用户尝试提交表单时,会触发`submitForm1()`函数。
这个函数首先获取用户在表单文本域中输入的内容,然后检查是否包含敏感词。
如果发现敏感词,它会调用`filterWord()`函数替换敏感词,并弹出提示让用户确认是否继续提交。
如果用户确认,表单会被提交;
否则,提交操作会被取消。
`filterWord()`函数接收用户输入的内容,读取敏感词列表,然后对每个敏感词调用`filterOneWord()`函数进行替换。
`filterOneWord()`使用正则表达式和`replace()`方法将敏感词替换为星号("**")。
表单部分的HTML代码如下:```html<form name="message_board" id="message_board" action="aaa.html"> <textarea name="message" id="message" cols="50" rows="10">"This is you post messsage"——phpdream</textarea> <br/> <input type="button" value="提交留言" id="submitMessage" onclick="submitForm1()" /></form>```需要注意的是,由于ActiveXObject是IE特有的,这种方法在其他非IE浏览器(如Chrome、Firefox、Safari或Edge)上无效。
为了实现跨浏览器兼容,可以考虑使用其他技术,如FileReader API(适用于现代浏览器)或者将敏感词库保存在服务器端,通过Ajax请求获取。
此外,为了使用ActiveXObject,用户需要在浏览器的安全设置中启用ActiveX控件,这可能带来安全风险,因此在实际应用中应谨慎使用,并确保对用户有明确的提示和说明。
2025/6/15 22:22:47 97KB
1
上传图片有两种方式:1.fileReader?可以把图片解析成base64码的格式,简单粗暴2.canvas?可以重新绘制一张图片,可以先把获取得到的图片的blob放进canvas里面,再生成宽高和透明度的图片,然后转成相应的类型传到后台,目前支持png和jpeg格式。
以上这篇ajax实现上传图片保存到后台并读取的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持软件开发网。
您可能感兴味的文章:Ajax上传图片并预览的简单实现ajax实现异步文件或图片上传功能
2018/5/24 13:45:52 169KB ajax 传照片 图片
1
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡