摘要:使用第一性原理探讨理解AI本质。

文章来源:宜信技术学院|宜信支付结算团队技术分享第二期-支付结算机器学习技术团队负责人 刘创 分享《AI与第一性原理》

分享者:宜信支付结算机器学习技术团队负责人 刘创

原文发布于个人博客:动物园的猪

一、AI和第一性原理

AI,也就是人工智能,这几年非常火,但究竟AI的本质是什么呢?用第一性原理来探寻AI的本质,可能更容易理解。接下来我们一起探讨AI、第一性原理、以及如何使用第一性原理来理解AI的本质。

二、第一性原理

2.1 什么是第一性原理

第一性原理,这个概念来自于古代希腊先哲——亚里士多德。

“在任何一个系统中,存在第一性原理,是一个最基本的命题或者假设,不能被省略,也不能被违反。” ——亚里士多德

听上去有些晦涩,但解释起来很简单,就是:任何事物,都有其内在存在的“第一性原理”。我的理解,就是其最最本质的东西,这个东西其实就在那里,是基于最基本的假设,你必须要认可它,它不需要什么前提和证明,有了它,你就可以去推演其他别的结论出来,这些结论最终形成了整个系统。

举几个例子吧。

我们初中就开始学习的牛顿的机械论,他的第一性原理就是万有引力,他所谓的“基本命题”就是万物之间有相互的吸引力,并在不受外力的时候,保持物体的运动惯性。这两个假设,构建出整个牛顿力学的整体大厦,指导着建筑、工业甚至天体物理的方方面面。

重新把这个概念推介给世人的埃隆马斯克,也是一位第一性原理的实践者。马斯克从小就有一个梦想:移民火星,所以他开始致力于民用火箭的开发。最开始他去找俄罗斯火箭公司合作,对方给他的报价是6500万美元以上,这个价格对他来说太过昂贵了。于是他重新思考这个问题,马斯克潜心研究火箭原理达2年时间,了解火箭制造的原理和流程,思考在火箭制造过程中最核心的成本在什么地方。经过不断思考和实践,马斯克的SpaceX公司将发射火箭的成本削减至原本的十分之一。

随后,他又开始思考如何降低其电动车制造公司Tesla电动车电池的高成本。当时储能电池的价格是每千瓦时600美元,这个价格对整车来说太过昂贵。马斯克带领团队仔细分析电池的组成,从第一性原理进行思考:电池组到底是由什么材质组成?这些电池材质在原料市场价格是多少?经过考察后他们发现,电池是碳、镍、铝和一些聚合物组成,如果从伦敦金属交易所购买这些原材料,只要 80 美元/千瓦时,与之前的价格相差8倍之多。也就是说如果他可以掌握制作电池的技术和方法,那就只剩下原材料的成本了。最终他们做到了,大幅降低了电池的成本,从而使得整个电动车工业蓬勃发展起来。

2.2 第一性原理和演绎法

第一性原理和演绎法是相生相伴的,演绎法其实就是三段论的推导,三段论指的是“大前提、小前提、结论”,大前提,就是指一般性的公理,而小前提往往是一些特例性的事实,有了大前提,小前提就可以依据这个演绎法推导出结论。

举个例子:“人都会死的,亚里士多德是人,所以亚里士多德也是会死的。”这是三段论的一个很浅显易懂的例子。

看到这里你是否会觉得这个方法很简单,好像没什么用呢?其实这里蕴含着一些东西,不知道你是否注意到。那就是,大前提至关重要,如果大前提错了,或者大前提并不是一个很稳固的假设,那结论就有可能不正确。

如何保证大前提正确呢?这就要求大前提也是依据演绎法推导出来的。也就是说,大前提是另一个演绎推理的结论,大前提还有一个它自己的大前提,在另一个演绎推理中,它作为那个大前提的结论存在。这就形成了一个递归,可以不断地向前追溯,直至达到第一性原理。

就像上学时的证明题,给你一些假设条件,让你依据一些推理公式得到最终的结论,这样得到的结论非常可信。

第一性原理和演绎法最经典的一个例子就是欧几里得的《几何原本》,他从最开始的5个公理、5个公设开始,推导出来476个几何结论,牢固坚实。

第一性原理,辅以演绎法,是我们思考这个世界的一个非常重要的方法。我们应该使用这种方法,建立我们看待这个世界的视角。对任何事物,我们都应该不断地去思索其最根本的原因和本质是什么?找到了这个本源、本质、它的第一性原理,其他的现象、结论和问题,都可以迎刃而解。

当然这不是一件容易的事情,在这个过程中,我们需要不断学习、思考,去伪存真,不断地思索,是否已经探究到事物最最本真的东西,不断地质疑,求证,反复推演,直至我们确信已经寻到了它。

三、人工智能

回到AI这个话题。2016年,AlphaGo战胜李世石,AI开始再次火起来,以至于创业圈、产业界甚至国家层面,都在热炒人工智能,到处都在宣扬人工智能将超越人类,人类将面临灭顶之灾的言论。可是,真的是这样么?让我们思考一下,这个最热的概念背后的本真是什么。

先举一个最近很火的AI小栗子,ZAO~

首先,为什么AI会火起来?可能你看到的是AlphaGo的胜利,而我看到的是科技作为生产力的匮乏。

我们经历过的IT革命、互联网大潮,至今已经持续了30多年,可是现在这两大技术支撑点已经开始面临红利消失的现状,人们急需一种新的科技形态来接过生产力的接力棒。左看右看,区块链过于炒作、物联网也迟迟无法落地、5G目前只局限在通讯行业...唯独AI-人工智能,似乎可以作为科技作为生产力的下一棒。就这样,AI被推上神坛,尽管它还不成熟,它还经历过3次低谷,然而对科技生产力的渴望,让人们急不可耐地把它推上了舞台。

聪明的你可能会问:为什么需要新的生产力?这正是第一性原理的思考方式,你在试图探究事物更深处的本源了,很为你点赞。

这个问题其实很难回答,谈谈我的理解,是因为如果没有新的生产力,就无法更多更高效地创造商品和价值,而不断膨胀的消费欲望和信贷扩张,就会戛然而止,世界的经济就会陷入停滞和衰退,从而引发各种经济、社会、政治问题。金融界的乔布斯Ray Dalio,曾经制作过一个30分钟讲述经济运行规律的视频,简单易懂地阐述了这个过程,感兴趣的你可以去谷歌一下。

抛开网上这些吹捧之词,我们来看AI产业到底发展如何呢?了解了这些,可能你就不会人云亦云地去跟着“他们”狂欢,亦或为人类未来的“灭绝”恐惧了。

然后,这个问题就变成了:我有什么办法可以最快速、高效和全面地了解目前的AI行业,而不是只听媒体上的片面之词呢。

我想到了一些办法:去36氪上查AI相关企业的融资情况,因为我坚信,投资人在理念、信息方面是远超一般人的,而且,真金白银投进去,他们一定会更谨慎更全面地考量。所以,观察他们对这些AI企业的投资情况、趋势以及额度,你就可以对这个行业的情况有一个基本了解。

我还找到了我认为目前在AI方向上做得最好的百度(当然你可以认为是其他企业,没有关系,这个很主观),去这些你认为的AI巨头的网站上,观察他们的行业案例、解决方案、技术白皮书,就可以迅速地知道一线企业究竟在什么地方做到了AI落地。

我还会去找一些AI企业的行研报告,通过专业咨询师的眼睛,快速领略他们眼中这个行业的情况,要知道,一份行研的价值是浓缩了专业人士花费了时间和金钱之后的量化指标和主观感受的结晶。

还有没有更好的、更客观、更低成本高效率的方法,帮助你了解这个行业的真实状况,这是你应该思考的东西,这样得到的结论,你自己才会更信服。

再回到AI这个专业领域上,什么时候AI这门学科最本真的东西呢?我最开始学习的时候,没有解答这个问题,所以学习效率不是很高,花了很长时间才摸到门。

了解一个学科首先得了解整个学科的框架,然后理解每个大的分类后面最本质的内容。人工智能这门学科确实太大了,就拿目前最火的深度神经网络来说吧,它其实只是机器学习的一个分支,只不过,神经网络的效果出奇地好,因此它才得以从众多机器学习方法中脱颖而出。

如果我们继续往深处探究,整个机器学习本质上就是在寻找数据中的统计规律,这个规律需要被表示,要么是通过线性方法,要么是通过非线性的方法,更一般的意义上,可以通过概率分布的方法。概率分布的密度函数,本身就是一个函数,既然是函数,就可以被数学上表示和拟合,而拟合方法,就可以通过深度神经网络的无数个神经元组成的组合表达出来。

如果再往深探究,本质是数学中的最优化理论,以及泛函中的万能逼近定理,包括寻找参数过程中的反向梯度下降等等,诸多理论,都是信息论、概率统计、泛函、最优化以及随机过程诸多数学分支中的严谨的数学定理在做支撑。

熟悉么?仿佛又回到了欧几里得的那个5个公理和5个公设的支撑,是的,整个人工智能,都是建立在近现代数学基础之上的,这正是第一性原理的完美诠释!

结语

所以,不要被媒体和专家们所迷惑,自己深入其中,去探究所谓的人工智能到底是什么,探求到它的本质,一切迷雾都会烟消云散。这就是第一性原理的思维方法。

无论是了解AI的过程,还是工作生活中遇到的问题,都不要被表象和喧闹所迷惑,沉下心来,认真探究事物本真的东西,拨开一层层别人给涂抹的外衣,看到它最内在的本源,这样,你就会少了很多迷茫,对工作、对生活,甚至对人生,多了一份自信和从容。

运用第一性原理探寻AI本质的更多相关文章

  1. AI本质就是“暴力计算”?看华为云如何应对算力挑战

    随着AI人工智能技术的飞速发展,相关的AI应用场景已经拓宽至各行各业.你可能想象不到的是,现在大家手上的智能手机的运算能力,甚至比美国航空航天局1969年登月计划中最先进计算机还高出几百上千万倍乃至更 ...

  2. 关于AI本质的思考

    前言 最近几天和一位朋友探讨了一下现阶段的人工智能以及未来发展,并且仔细重读了尤瓦尔赫拉利的“简史三部曲”,产生了一些关于AI的新想法,觉得有必要整理出来. 程序.AI的本质 现代的计算机都是基于图灵 ...

  3. 服务端、实时、大数据、AI计算

    服务端.实时.大数据.AI计算,各种各样的计算,计算机本质是什么,计算机的本质是 利用compute的计算速度为人提供更优的计算结果. 所以实时也好,准实时.离线.AI本质上是两个维度,实时准实时强调 ...

  4. 走进第四范式:决策类AI企业的生存之道

    根据不同的应用领域,人工智能行业可以分为视觉类人工智能.语音及语义类人工智能和决策类人工智能. 通常,我们接触的都是视觉类.语音类的人工智能,它们主要用来帮助人类执行具体任务,例如人脸识别,语音控制等 ...

  5. 【udacity】机器学习

    Evernote Export 2.人工智能简介 机器学习源自于人工智能,在此方向上,该领域有分为不同学派,机器学习主要关注的是制造能够自主动作的机器 3.人工智能难题 1.所有智能体都只有很少的计算 ...

  6. 必须得是一万小时的 刻意训练(deliberate practice)

    成功素质1:一万小时与格物致知 “格物致知14”的概念,我是从张银奎11老师那里了解到的.它的意思是“推究事物的原理,从而获得知识”,跟我在<透过现象看本质 - 写在观看WWDC 2016 Ke ...

  7. Git使用详细教程(8):Git分支

    目录 创建分支 查看分支 切换分支 删除分支 分支合并 探寻分支本质 创建分支 当我们使用git init projectName命令的时候,Git就会默认帮我们创建一个分支,名字叫做master. ...

  8. TS - 问题分析与处理的一般性方法

    本文是对解决问题的一些方法内容的改写与补充! 1 接触与了解 从总体着眼,从细节入手! 确认基本相关信息是必须执行的首要环节,也是后续处理问题的基础. 如果无法清楚地辨别或陈述问题的基本信息,那么,此 ...

  9. 浅谈Android发展趋势分析

    去年11月16.17日,我有幸参加了北京2017安卓技术大会,做了关于车载Android系统的演讲,并主持了诸多大咖参与的圆桌讨论,对Android未来几年的发展趋势进行了一番讨论.来自小米.百度.高 ...

随机推荐

  1. 实战spring自定义属性(schema)

    关于spring自定义属性(schema) 在开发Dubbo应用的时候,我们会在xml中做以下类似的配置: <dubbo:application name="dubbo_service ...

  2. Charles 修改请求/compose和Compose New

    本文参考:撰写工具/compose和Compose New 撰写工具/compose和Compose New compose 是在原有的请求基础上,修改: 可以写各种状态: – URL: – Meth ...

  3. python中os模块再回顾

    先看下我的文件目录结构 F:\PYTHON项目\ATM购物车\7月28 在此目录下的文件如下: 封装.py 模块os.sys复习.py 运行当前的文件是模块os.sys复习.py 1.获取当前文件所在 ...

  4. PTA A1007&A1008

    第四天 A1007 Maximum Subsequence Sum (25 分) 题目内容 Given a sequence of K integers { N1, N2, ..., NK }. A ...

  5. C语言入门-循环

    一.循环 输入一个数字,输出该数字有几位 #include <stdio.h> int main() { int x; int n = 0; scanf("%d" , ...

  6. rpm方式升级cenos6.7内核

    最近因为yarn集群问题需要配置cgroup.但是配置完成后操作系统内核奔溃. 查找资料后发现升级内核可以解决问题.在领导的大力支持下,对生产环境的计算节点(nodemanager)进行了批量升级内核 ...

  7. Hadoop核心组件之YARN

    YARN概述 Yet Another Resource Negotiator:另外资源的协调者 通用的资源管理系统 为上层应用提供统一的资源管理和调度 操作系统级别的调度框架,可以让各种计算框架运行在 ...

  8. Mybaits-从零开始-Spring、Spring MVC、MyBatis整合(未万待续)

    Spring.Spring MVC.MyBatis整合(未万待续)

  9. mysql 排序规则

    一.对比 1.utf8_general_ci 不区分大小写,utf8_general_cs 区分大小写 2.utf8_bin: compare strings by the binary value ...

  10. 【ADO.NET基础-Session】Session的基本应用

    在服务端存储状态的对象:Session和Application 在客户端存储状态的对象:Cookie 1.Session:每个独立的浏览器都会创建一个独立的Session,不是一台电脑一个Sessio ...