决策树的实现太...繁琐了. 如果只是接受他的原理的话还好说,但是要想用代码去实现比较糟心,目前运用了<机器学习实战>的代码手打了一遍,决定在这里一点点摸索一下该工程. 实例的代码在使用上运用了香农熵,并且都是来处理离散数据的,因此有一些局限性,但是对其进行深层次的解析有利于对于代码的运作,python语言的特点及书写肯定是有帮助的. 我们分别从每个函数开始: 计算香农熵 def calcShannonEnt(dataSet): numEntries = len(dataSet) labelC…
由于上一例的实现中只针对了离散数据,为了扩充处理范围,我实现了一下对线性数据的简单处理,在其中我选择用中位数作为指标,平均数.众数等等其他数据在我看来异曲同工,最终也都会有较相似的结构. 求连续数据的香农熵 def calcLinerData(dataSet): num=len(dataSet) count={1:0,0:0} shannonEnt=0.0 for i in range(num): feature = [ example[-1] for example in dataSet] f…
今天学习第一模块的最后一课课程--函数: python的第一个函数: 1 def func1(): 2 print('第一个函数') 3 return 0 4 func1() 1 同时返回多种类型时,将是返回一元组: 1 def func2(): 2 '],{'五':'六','七':8}#返回多种数据类型 3 data=func2() 4 print(data) 2 函数参数的调用: 1,位置调用:编写时需要一一对应,如果少了,或是多少都会出错! 1 def func3(x,y): 2 z=x+…
机器学习中会遇到一些离散型数据,无法带入模型进行训练,所以要对其进行编码,常用的编码方式有两种: 1.特征不具备大小意义的直接独热编码(one-hot encoding) 2.特征有大小意义的采用映射编码(map encoding) 两种编码在sklearn.preprocessing包里有实现方法 映射编码就是用一个字典指定不同离散型数据对应哪些数字 import pandas as pd df = pd.DataFrame([ ['green', 'M', 10.1, 'label1'],…
面向对象最重要的概念就是类(Class)和实例(Instance),必须牢记类是抽象的模板,比如Student类,而实例是根据类创建出来的一个个具体的“对象”,每个对象都拥有相同的方法,但各自的数据可能不同. 仍以Student类为例,在Python中,定义类是通过class关键字: class Student(object): pass class后面紧接着是类名,即Student,类名通常是大写开头的单词,紧接着是(object),表示该类是从哪个类继承下来的,继承的概念我们后面再讲,通常,…
python使用xlrd读取excel数据时,整数变小数: 解决方法: 1.有个比较简单的就是在数字和日期的单元格内容前加上一个英文的逗号即可.如果数据比较多,也可以批量加英文逗号的前缀(网上都有方法).(这种比较适合数据量较少的时候,如果数据量比较多,建议使用方法2) 2.通过程序代码判断单元格内容的ctype来解决 实例: for i in range(rows): if i==0: continue row_content = [] for j in range(cols-1): ctyp…
 Python Socket请求网站获取数据 ---阻塞 I/O     ->收快递,快递如果不到,就干不了其他的活 ---非阻塞I/0 ->收快递,不断的去问,有没有送到,有没有送到,...如果送到了就接收 ---I/O多路复用 ->找个代理人(select), 去收快递.快递到了,就通知用户.   一 . 阻塞方式 blocking IO 会一直block 对应的进程,直到操作完成 # 客户端请求网站-阻塞实现(一次一次的请求) import socket import time #…
python操作txt文件中数据教程[4]-python去掉txt文件行尾换行 觉得有用的话,欢迎一起讨论相互学习~Follow Me 参考文章 python操作txt文件中数据教程[1]-使用python读写txt文件 python操作txt文件中数据教程[2]-python提取txt文件中的行列元素 python操作txt文件中数据教程[3]-python读取文件夹中所有txt文件并将数据转为csv文件 误区 使用python对txt文件进行读取使用的语句是open(filename, 'r…
实例1.取得MYSQL的版本 在windows环境下安装mysql模块用于python开发 MySQL-python Windows下EXE安装文件下载 复制代码 代码如下: # -*- coding: UTF-8 -*- #安装MYSQL DB for pythonimport MySQLdb as mdb con = None try:    #连接mysql的方法:connect('ip','user','password','dbname')    con = mdb.connect('…
面向对象最重要的概念就是类(Class)和实例(Instance),必须牢记类是抽象的模板,比如Student类,而实例是根据类创建出来的一个个具体的“对象”,每个对象都拥有相同的方法,但各自的数据可能不同. 创建实例是通过类名+()实现的 类是创建实例的模板,而实例则是一个一个具体的对象,各个实例拥有的数据都互相独立,互不影响: 方法就是与实例绑定的函数,和普通函数不同,方法可以直接访问实例的数据: 通过在实例上调用方法,我们就直接操作了对象内部的数据,但无需知道方法内部的实现细节. 和静态语…