最近找了一本书,《语义web技术基础》----Pascal Hitzler等编著的。因为最近在看关于自然语言处理的一些东西,就顺带翻了一下,做一点学习笔记,方便以后查看。

本书的作者 Pascal Hitzler在美国莱特州立大学的课程(课程有点老,2012年的)

Knowledge Representation for the Semantic Web

的PPT链接:http://www.semantic-web-book.org/page/KR4SW-12

介绍本体的维基百科页面:https://zh.wikipedia.org/wiki/%E6%9C%AC%E4%BD%93_(%E4%BF%A1%E6%81%AF%E7%A7%91%E5%AD%A6)

1.三个主题(便于理解语义网络):

  建立模型:寻求用抽象的术语来描述一个复杂的世界,以得到对一个复杂现实的更容易的理解;

  用知识计算:尝试建立推理机,这样可以从编码知识中得出有意义结论;

  交换信息:在计算机间传递复杂信息资源,从而允许我们从全局规模对知识分布、互连、保持一致;

2.建立模型:

  与建立模型密切相关的就是“本体”这个术语。分为计算机领域的和哲学领域的。书中从哲学领域讲起,柏拉图到亚里士多德,到林奈的分类法,都是为了对自然对象建立更好的理解。

从而自然而然的引入了现代的建模。比如经典的建模语言:UML.

3.用知识计算:主要讲的是用已有的知识,数据进行推理,得到新的结果;

4.语义万维网:语义万维网是万维网的发明人TimBerners-Lee倡导的下一代万维网,旨在赋予万维网上信息资源以一种标识,在资源之间建立起机器可处理的各类语义联系,并致力于开发“以计算机可处理形式表示信息含义的语言”。

我的理解就是,互联网上不再是大量的html网页,而是各种标记良好、结构良好的资源的集合,根据你的搜索进行语义的推理,返回给你需要的知识。

5.本体:

  维基百科页面:https://zh.wikipedia.org/wiki/%E6%9C%AC%E4%BD%93_(%E4%BF%A1%E6%81%AF%E7%A7%91%E5%AD%A6)

  与语义网密不可分的一个概念就是本体。这里是在维基百科上找到的定义和信息:

  本体实际上就是对特定领域之中某套概念及其相互之间关系的形式化表达(formal representation)。本体是人们以自己兴趣领域知识为素材,运用信息科学的本体论原理而编写出来的作品。本体一般可以用来针对该领域的属性进行推理,亦可用于定义该领域(也就是对该领域进行建模)。

  作为一种关于现实世界或其中某个组成部分的知识表达形式,本体目前的应用领域包括(但不仅限于):人工智能语义网软件工程、 生物医学信息学图书馆学以及信息架构

  个人理解,本体就是对特定领域的知识的一个描述,这种描述结构良好,有各种实体和实体之间的关系。方便计算机理解和处理,根据这些描述,计算机可以进行推理,得出一些新的知识。

6.本体语言:

  本体一般都是采用本体语言来编制的。本体语言,又称为“本体论语言”,是一种用于编制本体的形式化语言

  比如:OWL,RIF。。。

7.RDF:资源描述框架

  是描述结构信息的一种形式化语言,目标是让应用程序在web上可以交互数据同事保留他们原有的含义。与HTML,XML不同的是,RDF不是想要正确的显示文本,而是允许进一步处理和重新组合其中包含的信息。所以RDF经常被看做是语义万维网的基本表示格式。

  一个RDF 文档描述了一个有向图,而不是像XML一样的层次良好的树形结构。以为RDF不是以为了结构化的文档而设计的,而是为了描述对象之间的关系而设计的。另外,RDF方便将各个来源的对象信息进行整合。

  RDF用统一资源标识符URI为名称来区分各种资源(对象),RDF图中的节点和边都用URI标识。书中花了大量的笔墨描写RDF URI的各种格式细节,个人觉得作为了解整体的框架不需要第一遍就看的这么详细,而且这些格式可能随着时间有一些改动直接看网上最新的就好了。

8.将RDF序列化成XML:

  三元组:主语谓语宾语;

  用图形的方式描述RDF分方便,但是不方便存储,所以用三元组的形式,序列化为xml存储;

  序列化:将复杂的数据结构线性化为字符串的方法;

9.OWL:网络本体语言 web ontology language

  原因: RDF(s)适合UI与简单本体的建模,并且允许隐含知识的推导,但是表达能力非常有限,不能表示复杂的知识,有一些复杂的问题不能对其进行建模;

为了对于更加复杂的知识进行建模,引入了更有表达能力的基于形式逻辑的表示语言 OWL;

  每一个OWL文档都是一个RDF文档;

10.阅读作者课程PPT:

  1)现在互联网上内容相当多,人类可以进行推理得到很多知识,但是机器不行,一些特殊的问题在网上都可以找到证据支持,但是缺少的是机器的推理能力,所以很难得到我们想要的答案;

  简单的推理例子:D.C. is a capital

          Every capital is a city

          Hence: D.C. is a city

  2)网上内容相当多,但是数据的结构、内容都比较糟糕;

  3)Meaning (semantics) provided via logic and deduction algorithms (automated reasoning).语义通过逻辑和自动推理表示;

  4)The core of an ontology is usually a taxonomy: – classes of things, arranged in a hierarchy

  5)Partonomy vs. Taxonomy 分体法和分类法:Ohio is part of USA,   grandfather is a father;

  6)对于RDF的解释:RDF is a data model

   – originally for describing metadata for web pages, but has grown beyond that 最开始为了描述网页元数据而出现

   – structured information 结构化的信息

   – universal, machine-readable data exchange format 普遍的,机器可读的一种交换格式

   – main syntax uses XML for serialization 用XML的语法来序列化

11.XML的相关语法结构:

  待续。。。。。。2017.4.10

语义web基础知识学习的更多相关文章

  1. Web基础知识和技术

    WEB是一个外延广泛的概念,不单单指网站,乌徒帮专注拥有WEB界面的网站开发,帮助初学者或已经进入开发的朋友们提供参考讨论平台,然而并不一定能将所有的WEB知识讲全讲透,只是能满足初涉者的建站需求,能 ...

  2. Python全栈开发之17、tornado和web基础知识

    一.web基础知识 学习web框架之前,先来看一下web基础知识,首先要明白其本质就是socket,用户对应一个socket客户端,但是如果从socket开始开发web应用程序那么效率太了,正确的做法 ...

  3. (转)Linux基础知识学习

    Linux基础知识学习 原文:http://blog.csdn.net/ye_wei_yang/article/details/52777499 一.Linux的磁盘分区及目录 Linux的配置是通过 ...

  4. Vue2基础知识学习

    Vue2基础知识学习 01.初识 new Vue({ el: '#root', //用于指定当前Vue实例为哪个容器服务,值通常为css选择器符 data () { return { } } }); ...

  5. GCC基础知识学习

    GCC基础知识学习 一.GCC编译选项解析 常用编译选项 命令格式:gcc [选项] [文件名] -E:仅执行编译预处理: -S:将C代码转换为汇编代码: -c:仅执行编译操作,不进行连接操作: -o ...

  6. Objective-c基础知识学习笔记

    Objective-c基础知识学习笔记(一) 一直有记录笔记的习惯.但非常久没分享一些东西了,正好上半年開始学习IOS了,如今有空写点.因开发须要,公司特意为我们配置了几台新MAC.还让我们自学了2周 ...

  7. AXAJ基础知识学习

    AXAJ基础知识学习 博客首页 Ajax简介 ajxa全称是Asynchronous Javascript And XML ,就是异步的JS 和XML 通过Ajax可以再浏览器中向服务器发送异步请求, ...

  8. web前端基础知识学习网站推介

    内容:一.基础知识及学习资料1. HTML入门学习:http://www.w3school.com.cn/html/index.aspHTML5 入门学习:http://www.w3school.co ...

  9. 韩天峰博客 php基础知识学习记录

    http://rango.swoole.com 写好PHP代码真的不容易,给大家几个建议: 慎用全局变量,全局变量不好管理的,会导致你的代码依赖于全局变量,而耦合度太高. 一定不要复制粘贴代码,可重用 ...

随机推荐

  1. Laravel中创建控制器

    <?php /** * Created by PhpStorm. * User: chuang * Date: 17-1-14 * Time: 下午4:29 */ namespace App\H ...

  2. eclipse java文件提示 The import XXX cannot be resolved

    问题:eclipse导入类   提示The import XXX cannot be resolved 原因:原来使用JDK和现在使用的JDK不同造成的buildpath不对 解決方法: 1.右键项目 ...

  3. 关于Springboot中dubbo整合注意的误区(不对之处请指出)

    这是我的客户端配置! 这是生产的配置, 首先注意一下 scan   我之前尝试这样的客户端配置 然后  果断客户端不能注册接口 @Reference(version="1.0") ...

  4. JavaScript中label与break配合使用

    语法 label: statement 说明 label语句可以在代码中添加标签,以便将来使用.定义的标签可以在将来由break或continue语句引用.加标签的语句一般都要与for语句等循环语句配 ...

  5. [NOIP2018TG]赛道修建

    [NOIP2018TG]赛道修建 考场上multiset调不出啊啊啊!!! 首先肯定是二分答案 做树形dp,f[i]表示i点的子树两两匹配后剩下的最长长度 匹配可以用multiset维护 但是菊花图跑 ...

  6. LINUX的LAMP环境搭配

    在ubuntu linux下以编译方式安装LAMP(apache mysql php)环境 最近转向到了使用ubuntu做 桌面,安装好系统以来一直都没配置lamp开发环境.由于很久以来没有自己编译安 ...

  7. MySQL权限系统(一).The MySQL Access Privilege System 概述

    纯属个人阅读,如有翻译错误,请指出 The primary function of the MySQL privilege system is to authenticate a user who c ...

  8. HDU1950-Bridging signals-最长上升子序列

    Description 'Oh no, they've done it again', cries the chief designer at the Waferland chip factory. ...

  9. Network Basic Knowledge

    @1: 应用层的常用协议以及对应的端口号: DNS 53/tcp/udp SMTP 25/tcp POP3 110/tcp HTTP 80/tcp HTTPS 443/udp TELNET 23/tc ...

  10. HTMLbutton控件中文字显示一直不居中

    在写HTML时,发现HTML中button控件中文字显示一直不居中, 最后发现是在标签前出现了一个全角空格引起的. 在Emeditor中将不显示的字符(空格,全角空格,换行,制表符)设置为显示,就可以 ...