语义web基础知识学习
最近找了一本书,《语义web技术基础》----Pascal Hitzler等编著的。因为最近在看关于自然语言处理的一些东西,就顺带翻了一下,做一点学习笔记,方便以后查看。
本书的作者 Pascal Hitzler在美国莱特州立大学的课程(课程有点老,2012年的)
Knowledge Representation for the Semantic Web
的PPT链接:http://www.semantic-web-book.org/page/KR4SW-12
介绍本体的维基百科页面:https://zh.wikipedia.org/wiki/%E6%9C%AC%E4%BD%93_(%E4%BF%A1%E6%81%AF%E7%A7%91%E5%AD%A6)
1.三个主题(便于理解语义网络):
建立模型:寻求用抽象的术语来描述一个复杂的世界,以得到对一个复杂现实的更容易的理解;
用知识计算:尝试建立推理机,这样可以从编码知识中得出有意义结论;
交换信息:在计算机间传递复杂信息资源,从而允许我们从全局规模对知识分布、互连、保持一致;
2.建立模型:
与建立模型密切相关的就是“本体”这个术语。分为计算机领域的和哲学领域的。书中从哲学领域讲起,柏拉图到亚里士多德,到林奈的分类法,都是为了对自然对象建立更好的理解。
从而自然而然的引入了现代的建模。比如经典的建模语言:UML.
3.用知识计算:主要讲的是用已有的知识,数据进行推理,得到新的结果;
4.语义万维网:语义万维网是万维网的发明人TimBerners-Lee倡导的下一代万维网,旨在赋予万维网上信息资源以一种标识,在资源之间建立起机器可处理的各类语义联系,并致力于开发“以计算机可处理形式表示信息含义的语言”。
我的理解就是,互联网上不再是大量的html网页,而是各种标记良好、结构良好的资源的集合,根据你的搜索进行语义的推理,返回给你需要的知识。
5.本体:
维基百科页面:https://zh.wikipedia.org/wiki/%E6%9C%AC%E4%BD%93_(%E4%BF%A1%E6%81%AF%E7%A7%91%E5%AD%A6)
与语义网密不可分的一个概念就是本体。这里是在维基百科上找到的定义和信息:
本体实际上就是对特定领域之中某套概念及其相互之间关系的形式化表达(formal representation)。本体是人们以自己兴趣领域的知识为素材,运用信息科学的本体论原理而编写出来的作品。本体一般可以用来针对该领域的属性进行推理,亦可用于定义该领域(也就是对该领域进行建模)。
作为一种关于现实世界或其中某个组成部分的知识表达形式,本体目前的应用领域包括(但不仅限于):人工智能、语义网、软件工程、 生物医学信息学、图书馆学以及信息架构。
个人理解,本体就是对特定领域的知识的一个描述,这种描述结构良好,有各种实体和实体之间的关系。方便计算机理解和处理,根据这些描述,计算机可以进行推理,得出一些新的知识。
6.本体语言:
本体一般都是采用本体语言来编制的。本体语言,又称为“本体论语言”,是一种用于编制本体的形式化语言。
比如:OWL,RIF。。。
7.RDF:资源描述框架
是描述结构信息的一种形式化语言,目标是让应用程序在web上可以交互数据同事保留他们原有的含义。与HTML,XML不同的是,RDF不是想要正确的显示文本,而是允许进一步处理和重新组合其中包含的信息。所以RDF经常被看做是语义万维网的基本表示格式。
一个RDF 文档描述了一个有向图,而不是像XML一样的层次良好的树形结构。以为RDF不是以为了结构化的文档而设计的,而是为了描述对象之间的关系而设计的。另外,RDF方便将各个来源的对象信息进行整合。
RDF用统一资源标识符URI为名称来区分各种资源(对象),RDF图中的节点和边都用URI标识。书中花了大量的笔墨描写RDF URI的各种格式细节,个人觉得作为了解整体的框架不需要第一遍就看的这么详细,而且这些格式可能随着时间有一些改动直接看网上最新的就好了。
8.将RDF序列化成XML:
三元组:主语谓语宾语;
用图形的方式描述RDF分方便,但是不方便存储,所以用三元组的形式,序列化为xml存储;
序列化:将复杂的数据结构线性化为字符串的方法;
9.OWL:网络本体语言 web ontology language
原因: RDF(s)适合UI与简单本体的建模,并且允许隐含知识的推导,但是表达能力非常有限,不能表示复杂的知识,有一些复杂的问题不能对其进行建模;
为了对于更加复杂的知识进行建模,引入了更有表达能力的基于形式逻辑的表示语言 OWL;
每一个OWL文档都是一个RDF文档;
10.阅读作者课程PPT:
1)现在互联网上内容相当多,人类可以进行推理得到很多知识,但是机器不行,一些特殊的问题在网上都可以找到证据支持,但是缺少的是机器的推理能力,所以很难得到我们想要的答案;
简单的推理例子:D.C. is a capital
Every capital is a city
Hence: D.C. is a city
2)网上内容相当多,但是数据的结构、内容都比较糟糕;
3)Meaning (semantics) provided via logic and deduction algorithms (automated reasoning).语义通过逻辑和自动推理表示;
4)The core of an ontology is usually a taxonomy: – classes of things, arranged in a hierarchy
5)Partonomy vs. Taxonomy 分体法和分类法:Ohio is part of USA, grandfather is a father;
6)对于RDF的解释:RDF is a data model
– originally for describing metadata for web pages, but has grown beyond that 最开始为了描述网页元数据而出现
– structured information 结构化的信息
– universal, machine-readable data exchange format 普遍的,机器可读的一种交换格式
– main syntax uses XML for serialization 用XML的语法来序列化
11.XML的相关语法结构:
待续。。。。。。2017.4.10
语义web基础知识学习的更多相关文章
- Web基础知识和技术
WEB是一个外延广泛的概念,不单单指网站,乌徒帮专注拥有WEB界面的网站开发,帮助初学者或已经进入开发的朋友们提供参考讨论平台,然而并不一定能将所有的WEB知识讲全讲透,只是能满足初涉者的建站需求,能 ...
- Python全栈开发之17、tornado和web基础知识
一.web基础知识 学习web框架之前,先来看一下web基础知识,首先要明白其本质就是socket,用户对应一个socket客户端,但是如果从socket开始开发web应用程序那么效率太了,正确的做法 ...
- (转)Linux基础知识学习
Linux基础知识学习 原文:http://blog.csdn.net/ye_wei_yang/article/details/52777499 一.Linux的磁盘分区及目录 Linux的配置是通过 ...
- Vue2基础知识学习
Vue2基础知识学习 01.初识 new Vue({ el: '#root', //用于指定当前Vue实例为哪个容器服务,值通常为css选择器符 data () { return { } } }); ...
- GCC基础知识学习
GCC基础知识学习 一.GCC编译选项解析 常用编译选项 命令格式:gcc [选项] [文件名] -E:仅执行编译预处理: -S:将C代码转换为汇编代码: -c:仅执行编译操作,不进行连接操作: -o ...
- Objective-c基础知识学习笔记
Objective-c基础知识学习笔记(一) 一直有记录笔记的习惯.但非常久没分享一些东西了,正好上半年開始学习IOS了,如今有空写点.因开发须要,公司特意为我们配置了几台新MAC.还让我们自学了2周 ...
- AXAJ基础知识学习
AXAJ基础知识学习 博客首页 Ajax简介 ajxa全称是Asynchronous Javascript And XML ,就是异步的JS 和XML 通过Ajax可以再浏览器中向服务器发送异步请求, ...
- web前端基础知识学习网站推介
内容:一.基础知识及学习资料1. HTML入门学习:http://www.w3school.com.cn/html/index.aspHTML5 入门学习:http://www.w3school.co ...
- 韩天峰博客 php基础知识学习记录
http://rango.swoole.com 写好PHP代码真的不容易,给大家几个建议: 慎用全局变量,全局变量不好管理的,会导致你的代码依赖于全局变量,而耦合度太高. 一定不要复制粘贴代码,可重用 ...
随机推荐
- Unity3d Resources TextAsset 文本
一些小型数据,可以用txt文本作为媒介,进行获取.传输.修改.存储: 比如:User1.2.3.txt,放入 Resources/Data 文件下: 一,Unity3d Resources.Load ...
- std::condition_variable(复习)
#include <iostream> // std::cout #include <thread> // std::thread #include <mutex> ...
- [Spring MVC]学习笔记--@RequestMapping支持的返回类型
下面针对官方文档列出的支持类型进行举例. (本篇例子存于github上, https://github.com/lemonbar/spring-mvc-requestmapping) 可以直接下载, ...
- 【BZOJ2005】[Noi2010]能量采集 欧拉函数
[BZOJ2005][Noi2010]能量采集 Description 栋栋有一块长方形的地,他在地上种了一种能量植物,这种植物可以采集太阳光的能量.在这些植物采集能量后,栋栋再使用一个能量汇集机器把 ...
- 宇视4G设备采用GB/T28181协议成功接入EasyGBS国标流媒体平台的设置流程
经过了多天的调试对接,终于将宇视的布控球顺利接入到了EasyGBS的国标平台,特地写一下对接过程中遇到的问题,希望能帮助大家避开一些麻烦: 第一步:电脑连接无线网络IPCWIFI,密码12345678 ...
- Json工具类库之Gson实战笔记
日常接口的数据传输通常使用xml或者json来传递数据,xml较庞大但是描述数据能力十分出众,json数据结构较小而且支持ajax传输,xml在数据传输和解析资源占用都比较逊色于json.因此日常的接 ...
- The C Programming Language Second Edition
%12d at least #include <stdio.h> main() { ,sum=,w=; ; ; w<=end; w++ ) { sum+=w; // for(wb= ...
- Exponential Backoff
f^x(f^y+f-m)+f-n =f^(x+y)+f^(f-m)+(f-n) <?php $exponent=0; w(80,3); function w($input,$base){ glo ...
- Javascript-Switch
JavaScript Switch 语句 请使用 switch 语句来选择要执行的多个代码块之一. 语法 switch(n) { case 1: 执行代码块 1 break; case 2: 执行代码 ...
- HTTP 状态码简介(对照)
HTTP状态码 当浏览者访问一个网页时,浏览者的浏览器会向网页所在服务器发出请求.当浏览器接收并显示网页前,此网页所在的服务器会返回一个包含HTTP状态码的信息头(server header)用以响应 ...