中文分词;文本分类;信息抽取;语义理解;问答系统;自然语言对话系统
2025/2/21 17:48:20 3.81MB NLP
1
知识图谱是一项综合性的复杂技术,其主要关注于知识的表示、知识图谱的构建以及应用这三个方面的研究内容。
其中知识的表示即是指三元组,知识图谱的构建则主要涉及信息抽取的相关技术。
2024/9/19 20:48:25 56.48MB 知识图谱 语义网络 Knowledge Graph
1
横瓜文件FTP下载资源搜索服务器主要用来架构图片搜索下载、视频搜索下载、图书搜索下载、软件搜索下载、电影搜索下载、MP3搜索下载、音乐搜索下载、游戏搜索下载等任何资源文件的搜索下载服务器。
最大并发连接数可达1000,仅依靠一台PC服务器,就可同时为1000个客户提供负载均衡的并发下载服务和检索服务,同时支持断点续传下载、迅雷下载、快车下载、IE浏览器HTTP下载等,在负载均衡方面,将迅雷快车等软件的风暴下载技术斩断成普通HTTP下载,实现了全体资源文件公平公正均衡下载的目标,节省了资源服务商带宽,提高了并发数量。
单个被下载文件最大可达2G字节,文件检索数量最多可达2000万个文件,扫描文件速度约2000个文件/秒,分词速度2500万字/分钟,平均检索时间小于0.001秒。
对于10万个文件,可在50秒内完成所有架构工作。
横瓜采用横瓜分布式Map数据库技术、分词索引技术、最大左匹配切词技术、倒排技术、MD5摘要信息抽取技术、新词智能识别技术、硬盘整理加速技术、疑似垂直搜索技术、中文海量词典技术、横瓜HTTP检索服务器web-search缓存技术、HTM转换TXT技术等,横瓜是根据文件名进行检索的,是基于Windows平台的WEB服务器软件系统,用来提供超大文件下载服务和检索服务。
横瓜PC硬件最低配置,需要700M内存、空闲硬盘空间1G、文件系统NTFS。
搜索引擎开发及合作,请联系QQ(601069289)安装说明:1、第一次使用软件前,先执行Setup.exe。
程序add.exe、title.exe为系统内核,勿动!2、架构搜索步骤:先将资源文件放在当前目录下的'file'文件夹('file'文件夹内可以随意组织子文件夹),然后单击websearch.exe程序的按钮“”创建索引“”,若标签提示分词完成,就可单击按钮“”WWW查询“”使用检索查询服务了。
若硬盘文件有变动,可重新单击“”创建索引“”来更新检索系统。
3、websearch.exe可实现扫描、索引、分词等,若要执行HTTP检索下载服务,websearch.exe须挂机。
4、websearch.exe挂机后,从IE中输入“”http://IP地址或域名:7777/“”可检索查询。
在www目录下,存有搜索引擎的主页和LOGO,客户可以根据个性需要自行修改。
5、使用本软件,必须开放端口:7000、7001、70002、70003、70004、7777、77786、本软件使用的基础词典已经用MD5加密封装,用户可以在dic.txt中自由添加新词,新词被添加到dic.txt后,被检索的几率变大。
若不添加新词,也可以被检索到,只是几率稍小些。
7、不得将本软件用于赢利目的、销售他人、非法用途等,否则将会被追究法律责任。
2024/8/7 12:17:16 3.32MB 服务器软件-FTP服务器
1
第一章:引言第二章:文本特征提取技术第三章:文本检索技术第四章:文本自动分类技术第五章:文本自动聚类技术第六章:话题检测跟踪技术第七章:文本过滤技术第八章:关联分析技术第九章:文档自动摘要技术第十章:信息抽取第十一章:智能问答(QA)技术第十二章:文本情感分析技术第十三章:Ontology第十四章:半结构化文本挖掘方法第十五章:文本挖掘工具与应用
2024/5/12 6:28:58 12.78MB 文本挖掘技术 北京大学 课件
1
《计算机科学丛书·多语自然语言处理:从原理到实践》是一本全面阐述如何构建健壮和准确多语种自然语言处理系统的图书,由两位资深专家编辑,集合了该领域众多尖端进展以及从广泛的研究和产业实践中总结的实用解决方案。
第一部分介绍现代自然语言处理的核心概念和理论基础,展示了现今理解单词和文件结构、分析语法、建模语言、识别蕴含和检测冗余。
第二部分彻底阐述与构建真实应用有关的实际考量,包括信息抽取、机器翻译、信息检索/搜索,总结、问答、提炼、处理流水线等。
2024/3/25 5:43:45 155.18MB 自然语言处理
1
统计自然语言处理第二版宗成庆pdf是一本经过第二次更新的统计自然语言方面的教材。
自然语言作为人类思想情感最基本,最直接,最方便的表达工具,无时无刻不充斥在人类社会的各个角落。
小编推荐的这本统计自然语言处理全面介绍了统计自然语言处理的基本概念、理论方法和新研究进展,内容包括形式语言与自动机及其在自然语言处理中的应用、语言模型、隐马尔可夫模型、语料库技术、汉语自动分词与词性标注、句法分析、词义消歧、篇章分析、统计机器翻译、语音翻译、文本分类、信息检索与问答系统、自动文摘和信息抽取、口语信息处理与人机对话系统等,既有对基础知识和理论模型的介绍,也有对相关问题的研究背景、实现方法和技术现状的详细阐述。
2024/2/2 9:26:17 16.87MB 自然语言处理 nlp
1
这是2018年CCKS会议上的关系抽取的综述性tutorial,对学习知识图谱意义重大
1
实体关系抽取作为信息抽取、自然语言理解、信息检索等领域的核心任务和重要环节,能够从文本中抽取实体对间的语义关系.近年来,深度学习在联合学习、远程监督等方面上的应用,使关系抽取任务取得了较为丰富的研究成果.目前,基于深度学习的实体关系抽取技术,在特征提取的深度和模型的精确度上已经逐渐超过了传统基于特征和核函数的方法.围绕有监督和远程监督两个领域,系统总结了近几年来中外学者基于深度学习的实体关系抽取研究进展,并对未来可能的研究方向进行了探讨和展望.
2023/11/21 3:24:24 1.85MB 深度学习 实体关系
1
中文信息抽取原理与使用程显毅编著北京:科学出版社(扫描版,带详细目录)
2023/3/17 18:24:39 24.96MB NLP 中文信息抽取 自然语言处理
1
最大派系问题是组合优化中经典而重要的问题,在信息抽取、信号传输、计算机视觉、社会网络及生物信息学等众多领域有着重要的使用。
现在根据派系的邻居信息提出1钟基于派系顶点和邻接边的派系过滤算法,来求解最大派系问题。
1
共 11 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡