机器学习之BP神经网络

import random

import math

#神经元的定义

class Neuron:

    def __init__(self,bias):

        self.bias = bias

        self.weights = []

    def calculate_output(self,inputs):

        self.inputs = inputs;

        self.output = self.squash(self.calculate_tocal_net_input())

        return self.output

    def calculate_tocal_net_input(self):

        total = 0

        for i in range(len(self.inputs)):

            total += self.inputs[i] * self.weights[i]

        return total + self.bias

    #激活函数sigmoid

    def squash(self,total_net_input):

        return 1/(1+math.exp(-total_net_input))

    #每一个神经元的误差是由平方差公式计算的

    def calculate_error(self,target_output):

        return 0.5 * (target_output - self.output) ** 2

    def calculate_pd_error_wrt_output(self, target_output):

        return -(target_output - self.output)

    def calculate_pd_total_net_input_wrt_input(self):

        return self.output * (1 - self.output)

    def calculate_pd_error_wrt_total_net_input(self, target_output):

        return self.calculate_pd_error_wrt_output(target_output) * self.calculate_pd_total_net_input_wrt_input()

    def calculate_pd_total_net_input_wrt_weight(self, index):

        return self.inputs[index]

#

# 参数解释：

# "pd_" ：偏导的前缀

# "d_" ：导数的前缀

# "w_ho" ：隐含层到输出层的权重系数索引

# "w_ih" ：输入层到隐含层的权重系数的索引

class NeuronLayer:

    def __init__(self, num_neurons,bias):

        #同一层的神经元共享一个截距项b

        self.bias = bias if bias else random.random()

        self.neurons = []

        for i in range(num_neurons):

            self.neurons.append(Neuron(self.bias))

    def inspect(self):

        print('Neurons:',len(self.neurons))

        for n in range(len(self.neurons)):

            print(' Neuron',n)

            for w in range(len(self.neurons[n].weights)):

                print('  Weight:',self.neurons[n].weights[w])

            print(' Bias:',self.bias)

    def feed_forward(self,inputs):

        outputs = []

        for neuron in self.neurons:

            outputs.append(neuron.calculate_output(inputs))

        return outputs

    def get_outputs(self):

        outputs =[]

        for neuron in self.neurons:

            outputs.append(neuron.output)

        return outputs

class NeuralNetwork:

    #学习率

    LEARNING_RATE = 0.5

    def __init__(self, num_inputs, num_hidden, num_outputs, hidden_layer_weights=None, hidden_layer_bias=None,output_layer_weights=None, output_layer_bias=None):

        self.num_inputs = num_inputs

        self.hidden_layer = NeuronLayer(num_hidden, hidden_layer_bias)

        self.output_layer = NeuronLayer(num_outputs, output_layer_bias)

        self.init_weights_from_inputs_to_hidden_layer_neurons(hidden_layer_weights)

        self.init_weights_from_hidden_layer_neurons_to_output_layer_neurons(output_layer_weights)

    def init_weights_from_inputs_to_hidden_layer_neurons(self, hidden_layer_weights):

        weight_num = 0

        for h in range(len(self.hidden_layer.neurons)):

            for i in range(self.num_inputs):

                if not hidden_layer_weights:

                    self.hidden_layer.neurons[h].weights.append(random.random())

                else:

                    self.hidden_layer.neurons[h].weights.append(hidden_layer_weights[weight_num])

                weight_num += 1

    def init_weights_from_hidden_layer_neurons_to_output_layer_neurons(self, output_layer_weights):

        weight_num = 0

        for o in range(len(self.output_layer.neurons)):

            for h in range(len(self.hidden_layer.neurons)):

                if not output_layer_weights:

                    self.output_layer.neurons[o].weights.append(random.random())

                else:

                    self.output_layer.neurons[o].weights.append(output_layer_weights[weight_num])

                weight_num += 1

    def inspect(self):

        print('------')

        print('* Inputs: {}'.format(self.num_inputs))

        print('------')

        print('Hidden Layer')

        self.hidden_layer.inspect()

        print('------')

        print('* Output Layer')

        self.output_layer.inspect()

        print('------')

    def feed_forward(self, inputs):

        hidden_layer_outputs = self.hidden_layer.feed_forward(inputs)

        return self.output_layer.feed_forward(hidden_layer_outputs)

    def train(self, training_inputs, training_outputs):

        self.feed_forward(training_inputs)

        # 1. 输出神经元的值

        pd_errors_wrt_output_neuron_total_net_input = [0] * len(self.output_layer.neurons)

        for o in range(len(self.output_layer.neurons)):

            # ∂E/∂zⱼ

            pd_errors_wrt_output_neuron_total_net_input[o] = self.output_layer.neurons[o].calculate_pd_error_wrt_total_net_input(training_outputs[o])

        # 2. 隐含层神经元的值

        pd_errors_wrt_hidden_neuron_total_net_input = [0] * len(self.hidden_layer.neurons)

        for h in range(len(self.hidden_layer.neurons)):

            # dE/dyⱼ = Σ ∂E/∂zⱼ * ∂z/∂yⱼ = Σ ∂E/∂zⱼ * wᵢⱼ

            d_error_wrt_hidden_neuron_output = 0

            for o in range(len(self.output_layer.neurons)):

                d_error_wrt_hidden_neuron_output += pd_errors_wrt_output_neuron_total_net_input[o] * \

                                                    self.output_layer.neurons[o].weights[h]

             # ∂E/∂zⱼ = dE/dyⱼ * ∂zⱼ/∂

            pd_errors_wrt_hidden_neuron_total_net_input[h] = d_error_wrt_hidden_neuron_output * \

                                                             self.hidden_layer.neurons[h].calculate_pd_total_net_input_wrt_input()

        # 3. 更新输出层权重系数

        for o in range(len(self.output_layer.neurons)):

            for w_ho in range(len(self.output_layer.neurons[o].weights)):

            # ∂Eⱼ/∂wᵢⱼ = ∂E/∂zⱼ * ∂zⱼ/∂wᵢⱼ

                pd_error_wrt_weight = pd_errors_wrt_output_neuron_total_net_input[o] * \

                                      self.output_layer.neurons[o].calculate_pd_total_net_input_wrt_weight(w_ho)

                 # Δw = α * ∂Eⱼ/∂wᵢ

            self.output_layer.neurons[o].weights[w_ho] -= self.LEARNING_RATE * pd_error_wrt_weight

        # 4. 更新隐含层的权重系数

        for h in range(len(self.hidden_layer.neurons)):

            for w_ih in range(len(self.hidden_layer.neurons[h].weights)):

            # ∂Eⱼ/∂wᵢ = ∂E/∂zⱼ * ∂zⱼ/∂wᵢ

                pd_error_wrt_weight = pd_errors_wrt_hidden_neuron_total_net_input[h] *\

                                      self.hidden_layer.neurons[h].calculate_pd_total_net_input_wrt_weight(w_ih)

            # Δw = α * ∂Eⱼ/∂wᵢ

            self.hidden_layer.neurons[h].weights[w_ih] -= self.LEARNING_RATE * pd_error_wrt_weight

    def calculate_total_error(self, training_sets):

        total_error = 0

        for t in range(len(training_sets)):

            training_inputs, training_outputs = training_sets[t]

        self.feed_forward(training_inputs)

        for o in range(len(training_outputs)):

            total_error += self.output_layer.neurons[o].calculate_error(training_outputs[o])

        return total_error

nn = NeuralNetwork(2, 2, 2, hidden_layer_weights=[0.15, 0.2, 0.25, 0.3], hidden_layer_bias=0.35, output_layer_weights=[0.4, 0.45, 0.5, 0.55], output_layer_bias=0.6)

for i in range(10000):

    nn.train([0.05, 0.1], [0.01, 0.09])

    print(i, round(nn.calculate_total_error([[[0.05, 0.1], [0.01, 0.09]]]), 9))

机器学习之BP神经网络的更多相关文章

菜鸟之路——机器学习之BP神经网络个人理解及Python实现
关键词: 输入层(Input layer).隐藏层(Hidden layer).输出层(Output layer) 理论上如果有足够多的隐藏层和足够大的训练集,神经网络可以模拟出任何方程.隐藏层多的时 ...
【机器学习】BP神经网络实现手写数字识别
最近用python写了一个实现手写数字识别的BP神经网络,BP的推导到处都是,但是一动手才知道,会理论推导跟实现它是两回事.关于BP神经网络的实现网上有一些代码,可惜或多或少都有各种问题,在下手写了一 ...
机器学习(4):BP神经网络原理及其python实现
BP神经网络是深度学习的重要基础,它是深度学习的重要前行算法之一,因此理解BP神经网络原理以及实现技巧非常有必要.接下来,我们对原理和实现展开讨论. 1.原理有空再慢慢补上,请先参考老外一篇不错的 ...
机器学习（一）：梯度下降、神经网络、BP神经网络
这几天围绕论文A Neural Probability Language Model 看了一些周边资料,如神经网络.梯度下降算法,然后顺便又延伸温习了一下线性代数.概率论以及求导.总的来说,学到不少知 ...
机器学习：从编程的角度理解BP神经网络
1.简介(只是简单介绍下理论内容帮助理解下面的代码,如果自己写代码实现此理论不够) 1) BP神经网络是一种多层网络算法,其核心是反向传播误差,即: 使用梯度下降法(或其他算法),通过反向传播来不断调 ...
机器学习：python使用BP神经网络示例
1.简介(只是简单介绍下理论内容帮助理解下面的代码,如果自己写代码实现此理论不够) 1) BP神经网络是一种多层网络算法,其核心是反向传播误差,即: 使用梯度下降法(或其他算法),通过反向传播来不断调 ...
机器学习入门学习笔记：（一）BP神经网络原理推导及程序实现
机器学习中,神经网络算法可以说是当下使用的最广泛的算法.神经网络的结构模仿自生物神经网络,生物神经网络中的每个神经元与其他神经元相连,当它“兴奋”时,想下一级相连的神经元发送化学物质,改变这些神经元的 ...
简单易学的机器学习算法——神经网络之BP神经网络
一.BP神经网络的概念 BP神经网络是一种多层的前馈神经网络,其基本的特点是:信号是前向传播的,而误差是反向传播的.详细来说.对于例如以下的仅仅含一个隐层的神经网络模型: watermark/ ...
基于steam的游戏销量预测 — PART 3 — 基于BP神经网络的机器学习与预测
语言:c++ 环境:windows 训练内容:根据从steam中爬取的数据经过文本分析制作的向量以及标签使用相关:无解释: 就是一个BP神经网络,借鉴参考了一些博客的解释和代码,具体哪些忘了,给出 ...

随机推荐

NSLog输出格式及随机数
NSLog输出格式及随机数 %@ 对象 %d, %i 整数 (%i和%d无差别,%i是老式写法,%d是新式写法而已.) %u 无符整形 %f 浮点/双字 %x, %X 二进制整数 %o 八进制整数 % ...
Java中this和super的使用
区别区别点 this super 访问属性访问本类中的属性,如果本类没有,则从父类继续查找访问父类中的属性调用方法访问本类中的方法,如果本类没有,则从父类继续查找直接访问父类的方法调用构 ...
走进Task（2）：Task 的回调执行与 await
目录前言 Task.ContinueWith ContinueWith 的产物:ContinuationTask 额外的参数回调的容器:TaskContinuation Task.Continue ...
Redis学习详解（一）：Redis持久化机制之RDB
Redis的持久化机制有两种:RDB持久化和AOF持久化.因为Redis是一个内存数据库,如果没有合适的持久化机制,那么一旦服务器进程退出,服务器中的数据库状态也会消失.本章介绍RDB持久化机制. R ...
.Net Core AOP之IExceptionFilter
一.简介在.net core 中Filter分为以下六大类: 1.AuthorizeAttribute(权限验证) 2.IResourceFilter(资源缓存) 3.IActionFilter(执 ...
Gerrit的用法及与gitlab的区别
来到一个新的团队,开发的代码被同事覆盖了.找同事核实,同事却说根本没有看到我的代码.经过一番沟通了解,原来他们的代码没有直接在gitlab上操作,而是先提交到gerrit,然后在提交到git.但是代码 ...
教你快速区分传统报表和商业智能BI
很多人分不清楚,传统报表和商业智能BI之间的区别?有些人认为,BI就是做报表的,其实不然,报表只是BI的一部分,报表是关于过去和现状的展示,而BI是关于如何通过分析数据,帮助决策者找到改变和提高的方案 ...
C# pdb类型文件的作用之一：记录具体异常的关键信息，如文件路径和行号
pdb 是 Program Debug Database 的简称: 背景我负责的一个Services(服务)出问题了,原因是一个 dll 内部逻辑出问题了: 在本地修改源码后,重新生成dll(Deb ...
Java -- List与数组转换
list转数组使用for循环使用list.toArray(new String[]),不可以强制转换list.toArray(),因为数组在jvm是一个object表示的,是一个对象数组转lis ...
小白文-SpringMVC-解读DispatcherServlet源码
SpringMVC 学习完Spring框架技术之后,差不多会出现两批人: 一批是听得云里雾里,依然不明白这个东西是干嘛的: 还有一批就是差不多理解了核心思想,但是不知道这些东西该如何去发挥它的作用. ...

机器学习之BP神经网络

机器学习之BP神经网络的更多相关文章

随机推荐

热门专题