郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! Summary 众所周知,化学突触传递是不可靠的过程,但是这种不可靠的函数仍然不清楚.在这里,我考虑这样一个假设,即大脑利用突触传递的随机性来进行学习,这类似于达尔文进化论中的基因突变.如果突触是“享乐主义的”,则可能发生这种情况,通过增加它们的囊泡释放或失败的概率来响应全局奖励信号,这取决于立即采取哪种动作.享乐主义突触通过计算对平均奖励梯度的随机近似来学习.它们与突触动态(例如短期促进和抑制)以及树突整合和动作电位生成的复杂性兼容…