【转载】 Nature再发DeepMind研究:AI复现大脑网格细胞模拟导航!
原文地址:
https://news.eeany.cn/news/416675-19.html
=======================================================
神秘的网格细胞:大脑内置GPS
从家出发到新的地点,再原路返回,从中选择尽可能的捷径,这是绝大多数动物都能胜任的简单任务。然而,大脑这种本能的导航机制尚未被完全理解。
科学家们在动物和人类大脑中找到了三种跟认路相关的细胞,分别是位置细胞、方向细胞和网格细胞。
位置细胞能在主体到达特定地点时放电,从而赋予对过往地点的记忆;方向细胞能感应前进的方向;网格细胞则是最神秘的一种:它们能将整个空间环境划分成蜂窝状的六边形网格,仿佛地图上的坐标系。
发现网格细胞的的莫索尔夫妇因此获得了2014年的诺贝尔生理学或医学奖。不过,网格细胞仅仅是在空间环境中提供GPS定位服务吗?一些科学家猜测,它们也会参与矢量计算,辅助动物规划路径。
人工神经网络中自动出现类似结构
DeepMind团队决定用人工神经网络检验上述猜想。人工神经网络是一种利用多层处理模拟大脑神经网络的运算结构。团队首先用深度学习算法训练神经网络学习哺乳动物的觅食运动路径,利用线速度、角速度等信号在视觉环境中进行定位。
研究人员随后发现,一种类似于网格细胞活动特征的结构自动诞生了!在此前的训练中,研究人员并未刻意引导神经网络产生此种结构。


人工神经网络中自动出现了与大鼠网格细胞(下)类似的网格结构(上) 图片来源:DeepMind官方博客
这再次显示了深度学习的可喜又可畏之处:这是一种通过大量匹配的输入和输出值训练机器自我摸索的算法,最后得到的机器逻辑是不为人知的黑匣子。正如AlphaGo自动领悟了人类千年棋史上从所未见的“天外飞仙”棋招,这次的神经网络也自动出现了令人惊喜的结构。
迷宫寻路
DeepMind团队随后利用强化学习检验这种网格结构是否能够进行矢量导航。强化学习被普遍用于训练游戏AI,人类告诉AI一种游戏的得分奖惩机制,但却不教授游戏方法,由AI在反复进行游戏、努力争取更高分的过程中自我进化。后期的AlphaGo就完全摈弃了人类棋谱经验,在纯粹的自我对弈中从零进化到更强版本。
研究人员将之前自动出现的网格结构与一个更大型的神经网络架构结合成了人工智能体,置于虚拟现实的游戏环境中。经历强化学习后,该人工智能在游戏迷宫中向目的地前进的导航能力超越了一般人,达到了职业游戏玩家水平。它能像哺乳动物一样寻找新路线和抄近路。

人工智能学习在迷宫中抄近路
最关键的是,当研究人员“静默”原来的网格结构后,人工智能体的导航能力就会变弱,判断目标的距离和方向都更不准确了。
论文作者之一Dharshan Kumaran说道:“我们证明了网格细胞远不只是给我们提供GPS定位信号,也是一种大脑赖以计算两个地点间的最短距离的核心导航机制。”
用人工智能代替小白鼠做实验
与一直强调“人工智能不是仿生学”的Facebook人工智能首席科学家杨立昆(Yann Lecun)不同,天才创始人戴密斯·哈萨比斯(Demis Hassabis)执掌的DeepMind热衷探索人工智能与脑科学的相辅相成。这项研究再一次体现了他们的科学理念:脑科学启发下的人工智能算法能反过来帮助人类探索大脑运行机制,从而也更好地理解人工智能的内在逻辑。
哈萨比斯评价道:“我们相信人工智能和神经科学是相互启发的。这项工作就是很好的证明:通过研发出一个能在复杂环境中导航的人工智能体,我们对网格细胞在哺乳动物导航中的重要性有了更深的理解。”
DeepMind团队相信,类似的研究方法还可以用来探索大脑听觉和控制四肢的机制。在更远的将来,神经科学家们甚至可以用人工智能代替小白鼠来做实验。
=============================================================
个人读后理解:
这个论文《Vector-based navigation using grid-like representations in artificial agents》主要做了什么?
grid-cells 是一种人类的脑神经结构,该神经主要的功能就是通过对位置信息编码(可能是使用视觉信号、速度信号等信号对当前空间位置信息进行编码),在人类脑神经研究中一直有两个观点,一个观点是grid-cells编码后的位置信息可以进行位置矢量计算的,比如计算出路径远近等,但是另一种观点却不这样认为,这篇人工智能的论文做的工作是什么呢:
首先,该论文利用速度信号、视觉信号对神经网络进行训练得到对空间位置信息的一种编码,而这种编码形式与人类脑神经中grid-cells的编码形式十分的相似,因此在一定程度上本文就姑且认为这种人工神经的编码和生物体中的编码是功能相似的;
然后,该论文将该种人工神经网络对空间位置编码后的信息交给一个更大的神经网络并通过强化学习算法进行寻路导航的训练,最后发现可以得到很好的效果,因此就得出与grid-cells相似的人工神经网络所得到的信息可以被用作空间矢量计算,这也在一定程度上支持了人类的grid-cells细胞编码后的空间信息也是可以进行空间矢量计算的。
说白了,这个论文就是发现一种与人类grid-cells细胞编码功能相似的人工神经网络结构,而该人工神经网络结构编码后的信息可以进行空间位置的矢量计算(和另一人工神经网络拼合后用强化学习进行训练),于是由此反推人类的grid-cells细胞编码后的信息也是可以在人脑中进行空间矢量计算的。也就是说人脑中某类脑神经结构功能不确定,但是人工神经网络中可以找到与其编码功能相似的人工神经网络结构,通过判断这个人工神经网络的功能来推断真实人脑中对应的那部分脑神经结构的功能。
总的来说,论文还是蛮新奇,搞的也蛮高大上,不过这个结论是否能站得住脚还是有得商榷,与人脑部分神经结构有一定相似编码形式的人工神经网络其在人工智能计算中具备的功能就一定在人脑对应的那部分真实细胞中也具备如此功能吗,这个也是不一定的,毕竟人工神经网络和真实的脑神经还是距离蛮大的,再者只通过这二者在编码形式上的相似就推断二者在其他功能上也具备相似性本身也是有些以偏概全的嫌疑。
========================================================
【转载】 Nature再发DeepMind研究:AI复现大脑网格细胞模拟导航!的更多相关文章
- Nature Biotechnology:人类基因研究走近平民 数据是基础解读更重要
Nature Biotechnology:人类基因研究走近平民 数据是基础解读更重要 5万美元可以做什么?最近,美国斯坦福大学教授斯蒂芬·夸克在国际著名学术期刊<自然·生物技术>发表论文宣 ...
- [转载]workbench分网---mapped face meshing面映射网格划分
原文地址:face meshing面映射网格划分">workbench分网---mapped face meshing面映射网格划分作者:一丝尘埃 face meshing面映射网格划 ...
- 【转载】NeurIPS 2018 | 腾讯AI Lab详解3大热点:模型压缩、机器学习及最优化算法
原文:NeurIPS 2018 | 腾讯AI Lab详解3大热点:模型压缩.机器学习及最优化算法 导读 AI领域顶会NeurIPS正在加拿大蒙特利尔举办.本文针对实验室关注的几个研究热点,模型压缩.自 ...
- 转载别人的DLL DEll研究
昨日,编了个DLL和EXE来进行了下测试,exe通过lib静态联编dll,来调用它的导出类,当改变DLL中导出类的结构(eg.成员变量的顺序等),从新发布DLL而不从新联结编译EXE,就会造成错误的执 ...
- 转载Liferay PortletPreference store()方法研究
我们对于PortletPreference 的store()用的非常广泛,很多情况下,我们一般对其进行一些设定,然后最后调用store()存储之,类似以下代码: PortletPreferences ...
- 【紧急】继续折腾,Log4j再发2.1.6,强烈建议升级
背景 继前天正式发布的2.15.0之后,Apache log4j 2 团队宣布 Log4j 2.16.0 发布! 由于SLF4J适配兼容性的中断,Log4j 现在发布两个版本的SLF4J to Log ...
- 【转载】 星际争霸2的AI环境搭建
原文地址: https://blog.csdn.net/qq_40244666/article/details/80957644 作者:BOY_IT_IT 来源:CSDN -------------- ...
- spring-data-redis的事务操作深度解析--原来客户端库还可以攒够了事务命令再发?
一.官方文档 简单介绍下redis的几个事务命令: redis事务四大指令: MULTI.EXEC.DISCARD.WATCH. 这四个指令构成了redis事务处理的基础. 1.MULTI用来组装一个 ...
- WPF ScrollViewer(滚动条) 自定义样式表制作 再发一套样式 细节优化
艾尼路 出的效果图 本人嵌套 WPF ScrollViewer(滚动条) 自定义样式表制作 图文并茂 WPF ScrollViewer(滚动条) 自定义样式表制作 (改良+美化) 源代码
- Delphi 实现无窗口移动(发WM_NCHITTEST消息计算,然后再发WM_SYSCOMMAND消息,带参数SC_DRAGMOVE)
procedure imgListMouseDown(Sender: TObject; Button: TMouseButton; Shift: TShiftState; X, Y: Integer) ...
随机推荐
- epoll使用与原理
使用要点 边缘模式(ET)与水平模式(LT)区别 下面内容来自linux man page The epoll event distribution interface is able to beha ...
- 基于redis的选主功能设计
需求背景 在JAVA应用开发过程中,越来越多的项目采用了微服务架构,而采用微服务架构最直接作用是可以实现业务层解耦,有利于研发团队可以从业务层面进行划分,比如某几个人的小团队负责某几个微服务,总之,从 ...
- nordic—RTC+PPI定时驱动某外设做非单次触发(本次测试为驱动GPIO口做电平翻转)
简介:在nordic的开发中使用到RTC时,对于比较通道0/1/2/3的中断来说,如果不进行相关配置(如SDK中例子,使用的RTC比较通道就只能触发一次,不能多次触发),会导致比较中断只进入一次,如果 ...
- 企业快速落地IT服务管理体系的六大关键步骤
许多企业在实施信息化战略时,一味地追求"技术高消费"而忽视了对信息技术的管理和内部业务流程的变革,侧重点仍然只是事后的技术支持和故障解决方面,随着企业对于信息技术的依赖程度的加重, ...
- 阅读mmdetection3d框架的源码探索其构建dataset的流程
在查看一些基于mmdetection3d构建的代码的时候,一开始会摸不着头脑,它的dataset到底是怎么构造的? 接下来就直接下载mmdetection3d这个仓库,然后去分析里面的代码. 可以看到 ...
- 开发工具-eclipse/idea 在运行前执行一些动作
毫无疑问,我们有的时候想在运行/编译程序前后执行一些动作.eclipse和idea都能支持. 日前正好遇到一个问题:有个依赖于pom的某个jar,内容虽然变了,但是版本不变,所以希望每次执行前先清除特 ...
- DDD 笔记
1. 简单讲讲DDD,和DDD哪些优势 领域驱动设计.就是通过领域来指导软件设计,是一种十分抽象的软件设计思想,它主要分为战略设计和战术设计 战略方面,通过事件风暴进行领域模型的划分,划分出核心域,子 ...
- 嵌入式编程的 4 种模型:轮询、中断、DMA、通道
轮询方式 对I/O设备的程序轮询的方式,是早期的计算机系统对I/O设备的一种管理方式.它定时对各种设备轮流询问一遍有无处理要求.轮流询问之后,有要求的,则加以处理.在处理I/O设备的要求之后,处理机返 ...
- ARM+DSP异构多核——全志T113-i+玄铁HiFi4核心板规格书
核心板简介 创龙科技SOM-TLT113是一款基于全志科技T113-i双核ARM Cortex-A7 + 玄铁C906 RISC-V + HiFi4 DSP异构多核处理器设计的全国产工业核心板,ARM ...
- 使用kafka作为生产者生产数据到hdfs
关键:查看kafka官网的userGuide 配置文件: agent.sources = r1agent.sinks = k1agent.channels = c1 ## sources config ...