最近几年,例如YAGO和DBpedia等大规模知识库发展有了很大的进步。
知识库提供了大量的不同种类的实体信息,如人、国家、河流、城市大学等等,同时知识库包含了大量的在实体(entity)间的关系既事实(fact)。
当今的知识库包含的数据量是巨大的通常有百万个实体和上亿个描述实体间关系的事实数据。
虽然目前的知识库存在大量的实体和事实数据,但是这样大规模的数据仍然不完整。
目前构建知识库的方法主要有两种,一种是从大量的文本中抽取事实但这种方法必然会带来大量的噪声数据,第二是人工扩展,但这样的方法对于时间的开销是极大的。
如果确保一个知识库是完整的则必须花费很大的努力来抽取大量的事实,并检查事实的正确性,因为只有正确的事实加入到知识库中才是有意义的。
同时知识库的本身由于有足够的信息可以推理出更多的新的事实。
例如有这样一个例子,一个知识库包含一组事实是孩子c有一个妈妈m,这样可以推理得出孩子妈妈的丈夫f很可能是孩子的父亲。
该逻辑规则形式化的描述如下:motherof(m,c)∧marriedTo(m,f)⟹fatherof(f,c)挖掘这种规则可帮助做一下四种事情:1、利用这种规则来推理出新的事实,而这些被挖掘出的新的事实可以使知识库更完整。
2、这些规则可以检测出知识库潜在的错误例如一个陈述是一个与一个男孩无关的人是这个男孩的父亲,这样的陈述很可能是错误的。
3、有很多推理工具依赖其他工具提供规则,所以这些被挖掘出来的规则可以用于推理。
4、这些规则描述一个普遍的规律,这些规律可以帮我我们理解分析知识库中的数据,如找到一些国家通常与说同一种语言的国家交易。
或结婚是一个对称关系,或使用同一个乐器的音乐家通常互相影响等等。
AMIE的目标是从RDF格式的知识库中挖掘如上所述的逻辑规则,在语义网(SemanticWeb)中存在大量的RDF知识库如YAGO、Freebase和DBpedia等。
这些知识库使用RDF三元组(S,P,O)提供二元关系(binaryrelation)的描述。
由于知识库一般只包含正例而(S,P,O)没有反例(S,¬P,O),所以RDF这样的知识库中仅能通过正例来推理。
进一步来说在RDF知识库上的操作是基于开放世界假设(OWA)的。
在开放世界假设下,一个事实没有在知识库中存在那么我们不能说这个事实是错误的,只能说这个陈述是未知的。
这与标准的数据库在封闭世界假设的设定有本质上的区别。
例如在知识库中没有包含marry(a,b),在封闭世界假设中我们可以得出这个a没有和b结婚而在开放世界假设下我们只能说a可能结婚了也可能单身。
压缩包内包含AMIE可运行源代码与相应文档资料,欢迎下载参考
2025/4/10 17:38:48 2.43MB 不完整 知识库 关联规则 数据挖掘
1
是一本数学分析的反例的经典书籍。
为pdf格局。
总共有545页
2018/1/9 4:50:30 6.46MB 实分析 反例
1
1.【强制】所有编程相关命名均不能以下划线或美元符号开始,也不能以下划线或美元符号结束。
反例:_name/__name/$Object/name_/name$/Object$2.【强制】所有编程相关的命名严禁使用拼音与英文混合的方式,更不允许直接使用中文的方式。
说明:正确的英文拼写和语法可以让阅读者易于理解,避免歧义。
注意,即使纯拼音命名方式也要避免采用。
反例:DaZhePromotion[打折]/getPingfenByName()[评分]/int变量=3;正例:ali/alibaba/taobao/cainiao/aliyun/youku/hangzhou等国际通用的名称,可视为英文。
3.【强制】类名使用UpperCamelCase风格,必须遵从驼峰方式,但以下情形例外:(领域模型的相关命名)DO/DTO/VO/DAO等。
正例:MarcoPolo/UserDO/XmlService/TcpUdpDeal/TaPromotion反例:macroPolo/UserDo/XMLService/TCPUDPDeal/TAPromotion...
2015/8/9 15:23:27 230KB 阿里 java 编程规范 开发规范
1
决策树算法与决策树相关的重要算法1、Hunt,Marin和Stone于1966年研制的CLS学习系统,用于学习单个概念。
2、1979年,J.R.Quinlan给出ID3算法,并在1983年和1986年对ID3进行了总结和简化,使其成为决策树学习算法的典型。
3、Schlimmer和Fisher于1986年对ID3进行改造,在每个可能的决策树节点创建缓冲区,使决策树可以递增式生成,得到ID4算法。
4、1988年,Utgoff在ID4基础上提出了ID5学习算法,进一步提高了效率。
1993年,Quinlan进一步发展了ID3算法,改进成C4.5算法。
5、另一类决策树算法为CART,与C4.5不同的是,CART的决策树由二元逻辑问题生成,每个树节点只要两个分枝,分别包括学习实例的正例与反例。
CLS,ID3,C4.5,CART第6章决策树
2015/7/6 13:16:21 1.15MB 决策树
1
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡