ES: 机器学习、专家系统、控制系统的数学映射
一、基本定义
1.机器学习维基定义:机器学习有下面几种定义: “机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能”。 “机器学习是对能通过经验自动改进的计算机算法的研究”。 “机器学习是用数据或以往的经验,以此优化计算机程序的性能标准。” 一种经常引用的英文定义是:A computer program is said to learn from experience E with respect to some class of tasks T and
performance measure P, if its performance at tasks in T, as measured by P, improves with experience E.
2.专家系统维基定义:可以看作是一类具有专门知识和经验的计算机智能程序系统,一般采用人工智能中的知识表示和知识推理技术来模拟通常由领域专家才能解决的复杂问题。一般来说,专家系统=知识库+推理机。
3.控制系统还没有维基定义:自动控制系统是在无人直接参与下可使生产过程或其他过程按期望规律或预定程序进行的控制系统。自动控制系统是实现自动化的主要手段。
4.语义维基定义:语义学(英语:Semantics,法语:La sémantique),也作“语意学”,是一个涉及到语言学、逻辑学、计算机科学、自然语言处理、认知科学、心理学等诸多领域的一个术语。虽然各个学科之间对语义学的研究有一定的共同性,但是具体的研究方法和内容大相径庭。语义学的研究对象是自然语言的意义,这里的自然语言可以是词汇,句子,篇章等等不同级别的语言单位。但是各个领域里对语言的意义的研究目的不同:
- 语言学的语义学研究目的在于找出语义表达的规律性、内在解释、不同语言在语义表达方面的个性以及共性;
- 逻辑学的语义学是对一个逻辑系统的解释,着眼点在于真值条件,不直接涉及自然语言;
- 与计算机科学相关的语义学研究在于机器对自然语言的理解;
- 认知科学对语义学的研究在于人脑对语言单位的意义的存储及理解的模式。
5.语法维基定义:语言学中语法(英语:Grammar)是指任意自然语言中控制子句、词组以及单词等结构的规则,这一概念也被用来指对于这些规则进行研究的学科,例如词法学、语法学或音韵学等,并和其他学科如语音学、语义学或语用学互相补充。在很多文献中,语言学家通常不用“语法”来指正写法。
二、语法论
叔本华先生的代表作之一为《作为意志和表象的世界》,这本书是我唯一读完三遍的哲学著作,虽然读完之后大概内容会完全忘掉,感觉却慢慢加深。世界是我的表象,整个世界的表象随着时间不断变化发展,而作为智能体的人对世界表象的反射作为思想和记忆存储在大脑里。大脑的容量总是不够的,若存储表象太困难了,还好表象与本质有本质的联系,其中有一种联系:叫做规则,有时候人存储了少量规则和少量表象,便可以了解大部分世界或者世界的大部分。
自然语言作为人类的概念工具,是世界表象的映射,若语言对表象世界的描述是双射的,那么这种自然语言便是无二义性的。只是现代语言其丰富度还难以精细描述表象世界,有意或者无意之间借助于规则,语言对世界的描述层面一般显示出二义性。
自然语言的天生二义性缓慢演进,暂且搁置。自然语言是世界的一个很好的表象描述,分析自然语言可以对其代表的本质——自然世界有一个很好的理解。
自然语言对世界的描述,形式化为“语义”,即是我们所说的“概念”。自然语言的表现有其内在要求,这就是语法,即是自然语言的规则。自然语言是一个AI难的问题,根本在于世界太复杂,对世界的描述必须上升到 智能 的水平,必须了解“智能” 的含义。
“智能”最主要的一个方面是可演进性,智能首先是一个系统,系统要素最终使系统进化或者灭亡。进化的“智能”更好的与世界适应,富否则灭亡。
再回到哲学,黑格尔的哲学 语义价值 受到马克思先生的极大批判,但其学说曾经如此流行,必有过人的地方,这就是黑格尔的 辩证法。哲学不能否认前向链和因果论的正确性,这是一切系统运行的基础。黑格尔的逻辑辩论能力非常强大,对哲学思想这个语义系统的语法——逻辑推理运用的恰到好处,才奠定了他在哲学的地位。
一个好的语法系统可以构建一个强有力的语义系统.....
语义 的模型论 和语法的证明论 关联 暂时还不明白...。
二、语义论
专家系统所阐述的语义为知识状态,通过逻辑规则进行推理,得到终止状态即解决方案。维基的阐述:专家系统适合于完成那些没有公认的理论和方法、数据不精确或信息不完整、人类专家短缺或专门知识十分昂贵的诊断、解释、监控、预测、规划和设计等任务。一般专家系统执行的求解任务是知识密集型的。
维基的中文解释不是特正确,专家系统的确定性是专家系统的内在要求之一,具有模糊逻辑的专家系统其本质上是确定的。
值得修改的地方是:专家系统使用的是有确定的公理和方法的系统。即使具有模糊规则,模糊规则的可能性概率必须是可以预测的,这才符合我们对科学可验证的初始要求。专家系统更符合语义系统的追逐——完备性,专家系统的语义系统必须是完备的,从任何一个初始状态出发,经过一系列的推理规则,不能得到矛盾的结果。
而机器学系系统呢,对于完备性的映射是“过拟合”。 过拟合同于目标泄露。
专家系统的可以形式化为状态机模型。有限状态机(英语:finite-state machine,缩写:FSM)又称有限状态自动机,简称状态机,是表示有限个状态以及在这些状态之间的转移和动作等行为的数学模型。
FSM(有限状态机)可以使用上面图1那样的状态图(或状态转移图)来表示。此外可以使用多种类型的状态转移表。下面展示最常见的表示:当前状态(B)和条件(Y)的组合指示出下一个状态(C)。完整的动作信息可以只使用脚注来增加。包括完整动作信息的FSM定义可以使用状态表。
-
-
状态转移表 当前状态→
条件↓状态A 状态B 状态C 条件X … … … 条件Y … 状态C … 条件Z … … …
-
状态转移表 映射为 规则,即为状态转移规则。
专家系统是一个反复验证扩增的过程。专家是基于规则的系统,规则的粒度决定了专家系统正确性和稳定性,一般两种特性不可得兼。专家系统的语义是稀疏的,规则的粒度决定语义的表达空间疏密程度。语义的完备性要求状态点可以完全且唯一解析。若状态点不能被规则系统解析,一个可行的方法为规则细分化,通过增加语义空间密度来解析状态点。同样若状态点得到了矛盾的解析,可行的方法为规则细分化,或者修改规则。在修改规则和规则细分化的同时,仍然要保持语义的完备性,遍历整个专家系统状态。
机器学习呢,可以看做是侧重于专家系统的规则提取过程的专家系统预处理方法。若规则是显式的,且必须保持完备性,则为专家系统;若规则难以描述,则是神经网络。贝叶斯网络也是专家系统的一中,MCMC方法依然可以划分为规则系统的范畴。
三、机器学习
机器学习侧重于规则的正确性,通过模型的泛化性能来调整机器学习规则粒度和规则走向(参数),与专家系统的完备性要求侧重点不同。ML的模型又称为算法,机器学习与泛函分析联系紧密。
对于世界模型的实例分类,同态于名词范畴,林奈分类法是一个成功的实例。先验经验和特征提取的隐式规则 是世界表象的本质联系所决定的。为何一直推崇标准建类模型?标准建类模型意指使用标准的建类规则,使用合适的类定义粒度,合适的类划分层次,拟合世界表象的概念模型,促进计算机语义描述的标准化和拟人化。
对于世界模型的联系分类,同态于动词范畴,联系范畴的定义比名词少的多,谓词的细分化比主宾的细分化要简单的多,名词的组合规则复杂,生成的实例多样纷杂。而联系可以被隔离,实例系统具有相似性,实体组合新名词一个联系发生变化便可以产生新的实体,从此意义上说,联系的量级为实体的ln级别。动词的一个特性便是可以泛化,类似于计算机语言设计C++中的规则“多态”或者JAVA中的“借口”。多态和接口的实现极大地减少了语言描述世界的复杂度。
名词代表的实例通过和其他实例或联系,服从特定的“组合规则”,构建无限可能多的组合,深刻的阐述了“组合爆炸”这个特性。实例的粒度和实例的量级有着千丝万缕的关系,实例的内部和外部联系构建规则。规则或许和联系从属于一个量级,规则也许和联系可以封装。
1.机器学习对实例的分类受到实例粒度和实例组分复杂度的限制,表现为特征工程的特征抽取维度。即使是离散空间,实例粒度越小、实例组分越多,特征维度越高,机器学习的模型必然会更复杂,就像“英国的海岸线”一样。从这个尺度上说,机器学习对规则的抽取性能一开始就是被限定的。
机器学习对实例的判别模型与专家系统对状态的解析模型类似。
特征工程是机器学习最重要的部分。使用人力对实例进行特征提取,企图希望用X个维度的(离散/连续)特征(数)值来描述无限维度的表象世界,期待特征是表象实例的单射,这个过程使用了大量的经验。特征工程有一劳永逸的方法吗?应该没有吧!人力在应用目标和表象初始状态中构建特征提取规则,这是一个基于规则的特征提取专家系统,会表现出专家系统的所有特征。
图像模式识别是一个“AI”难的过程,因为特征工程的专家系统构建过程是一个真正的智能过程,而我们所谓的“语义鸿沟”是因为我们追逐极度降维,仍然能保持概念映射的单射性质。
2.机器学习对联系的分类会简单的多,因为联系的特征一般是明晰的,维度也较低。对规则抽取规则,引入元机器学习。
四、元机器学习
证明语义完备性的理论为模型论,证明语法完备性的理论为证明论。人工智能一定会实现的,且强人工智能一定会实现的,只是一旦他实现,若不依赖于与人类似的自然资源,那么他会为自身的生存构建一个更合适的自然界,这才是生存争夺战的源头。
我们构建了“三北防护林”,抵挡沙漠,因为我们所依赖的资源不能从沙漠这种环境中获取。经济基础决定上层建筑,人类意识不可能对自身躯壳不加保护,人类躯壳所需要的存在资本依然与这个自然界不可分割。
状态的转换需要能量,我们需要消化作用,需要食物和氧气。我们更需要这个躯壳正常的运行,保持能量源源不断地可以被供应,维持意识的状态转变。我们更需要这个能量机器稳定存在的环境并实施对她维护,因此我们和这个原始自然界有着千丝万缕的联系。
森林和海洋用于光合作用产生氧气和食物,我们不能永远地开辟城市到任何地方。还要保证能量产生机器的正常运转,因此治理“雾霾”。保证洁净的饮用水作为能量载体,和能量产生的重要容器。
智能的原因还未能探测到,因此,“元认知“还是处于哲学的认知阶段。对人类智能的认识不仅是自然界和科学本身在阻碍,生存本能的延伸——伦理也在限制这 对认知/智能的剖析,元认知的过程困难重重。
幸好,机器学习系统是人类专家从0开始构建的系统,机器学习的整个模型生成的规则是可以被公理化描述,规则的规则也可以被描述,深入到”元机器学习“。
对机器学习这个专家系统来解析一番,进入元认知的阶段。
五、模型的复杂度和完备性
专家系统的完备性和机器学习的完备性不在一个层次,专家系统的完备性为语义的完备性,是一个永无止境的过程。机器学习系统的完备性是语法的完备性,可以 从逻辑 层面得到严谨的证明。
那么机器学习的完备性便是证明整个规则的正确性。
一个机器学习系统,构建一个专家系统,然后构建过程依赖了控制系统。
ES: 机器学习、专家系统、控制系统的数学映射的更多相关文章
- ES入门三部曲:索引操作,映射操作,文档操作
ES入门三部曲:索引操作,映射操作,文档操作 一.索引操作 1.创建索引库 #语法 PUT /索引名称 { "settings": { "属性名": " ...
- SIGAI机器学习第三集 数学知识-2
讲授机器学习相关的高等数学.线性代数.概率论知识 大纲: 最优化中的基本概念梯度下降法牛顿法坐标下降法数值优化算法面临的问题拉格朗日乘数法凸优化问题凸集凸函数凸优化拉格朗日对偶KKT条件 最优化中的基 ...
- [机器学习]SVM---硬间隔最大化数学原理
注:以下的默认为2分类 1.SVM原理: (1)输入空间到特征空间得映射 所谓输入空间即是输入样本集合,有部分情况输入空间与特征空间是相同得,有一部分情况二者是不同的,而模型定义都是定义到特征空间的, ...
- 机器学习入门-数值特征-数字映射和one-hot编码 1.LabelEncoder(进行数据自编码) 2.map(进行字典的数字编码映射) 3.OnehotEncoder(进行one-hot编码) 4.pd.get_dummies(直接对特征进行one-hot编码)
1.LabelEncoder() # 用于构建数字编码 2 .map(dict_map) 根据dict_map字典进行数字编码的映射 3.OnehotEncoder() # 进行one-hot编码 ...
- Pytoch机器学习乱玩(一):数学建模作业,体重与心率
动物心率与体重的模型 动物消耗的能量p主要用于维持体温,而体内热量通过其表面积S散失,记动物体重为w,则\(P \propto S \propto w^{\alpha}\).又\(P\)正比于血流量\ ...
- 可能是史上最全的机器学习和Python(包括数学)速查表
新手学习机器学习很难,就是收集资料也很费劲.所幸Robbie Allen从不同来源收集了目前最全的有关机器学习.Python和相关数学知识的速查表大全.强烈建议收藏! 机器学习有很多方面. 当我开始刷 ...
- ES 12 - 配置使用Elasticsearch的动态映射 (dynamic mapping)
目录 1 动态映射(dynamic mapping) 1.1 什么是动态映射 1.2 体验动态映射 1.3 搜索结果不一致的原因分析 2 开启dynamic mapping策略 2.1 约束策略 2. ...
- 分享 - 27 个机器学习、数学、Python 速查表
转载自:伯乐在线 - iPytLab,原文链接,侵删 机器学习涉及到的方面非常多.当我开始准备复习这些内容的时候,我找到了许多不同的”速查表”, 这些速查表针对某一主题都罗列出了所有我需要知道的知 ...
- [Machine Learning] 国外程序员整理的机器学习资源大全
本文汇编了一些机器学习领域的框架.库以及软件(按编程语言排序). 1. C++ 1.1 计算机视觉 CCV —基于C语言/提供缓存/核心的机器视觉库,新颖的机器视觉库 OpenCV—它提供C++, C ...
随机推荐
- Scrapy处理200-300范围之外的响应代码
HttpErrorMiddleware 类scrapy.spidermiddlewares.httperror.HttpErrorMiddleware 过滤掉不成功(错误)的HTTP响应,以便蜘蛛不必 ...
- 整理Crontab 定时计划
一. 什么是crontab? crontab命令常见于Unix和类Unix的操作系统之中,用于设置周期性被执行的指令.该命令从标准输入设备读取指令,并将其存放于“crontab”文件中,以供之后读取和 ...
- 减小数据库Log文件大小 1MB 为自定义大小
--减小数据库Log文件大小 1MB 为自定义大小USE [master]GOALTER DATABASE DataBaeName SET RECOVERY SIMPLE WITH NO_WAITGO ...
- vue: This relative module was not found
这是今天运行vue项目报的一个错误,特地在此记录一下. 错误信息如下: ERROR Failed to compile with 1 errors This relative module was n ...
- hibernate4.3版本构造SessionFactory方法
hibernate3.X构造SessionFactory方法 //读取hibernate.cfg.xml文件 Configuration cfg = new Configuration().confi ...
- NYIST 914 Yougth的最大化
Yougth的最大化时间限制:1000 ms | 内存限制:65535 KB难度:4 描述 Yougth现在有n个物品的重量和价值分别是Wi和Vi,你能帮他从中选出k个物品使得单位重量的价值最大吗? ...
- Spring MVC-表单(Form)标签-复选框(Checkbox)示例(转载实践)
以下内容翻译自:https://www.tutorialspoint.com/springmvc/springmvc_checkbox.htm 说明:示例基于Spring MVC 4.1.6. 以下示 ...
- binlog
binlog基本定义:二进制日志,也成为二进制日志,记录对数据发生或潜在发生更改的SQL语句,并以二进制的形式保存在磁盘中: 作用:MySQL的作用类似于Oracle的归档日志,可以用来查看数据库的变 ...
- 【bzoj1025】【SCOI2009】【游戏】【dp】
Description windy学会了一种游戏.对于1到N这N个数字,都有唯一且不同的1到N的数字与之相应.最開始windy把数字按顺序1,2.3.--,N写一排在纸上. 然后再在这一排以下写上它们 ...
- linux高级技巧:rsync同步(二)
1.配置两个节点同步 上个帖子已经展示了同步一个主机的方法.这次我们再加入一个要同步的主机. 方法上并无二质. 1.首先显示我们的控制台: ...