分类学习####

分类算法各有不同

knn

naivebyes

regression

dnn

sklearn.linear_modlel 线性函数

sklearn.preprocessing 非线性函数

分类##

基本分类模型###

knn####

sklearn.neighbors.KNeighborsClassifier

n_neighbors

weights 设置选择k个点对分类效果的影响权重

uniform,distance

algothrim 计算临近点的方法 ball_tree kd_tree brute auto

...

  • 实例介绍

    neigh=KNeightborsClassifier(neigh)

    neigh.fit(X,y)

    neigh.predict([[1.1]])

决策树####

构造好的分类决策树

sklearn.tree.DecisionTreeClassifier

criterion : 用于选择属性的准侧,可以传入gini代表基尼系数,entropy代表信息增益

max_features: 表示节点分裂时,从所少个特征中选择最优特征,可以设定固定数木,百分比,或其他个数,默认是所有特征

人体姿态预测###

这个数据集好偏啊,运行效果并不好。

# -*- coding: utf-8 -*-
"""
Created on Wed May 24 17:41:04 2017 @author: sfzyk
"""
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
from sklearn.preprocessing import Imputer
from sklearn.model_selection import train_test_split
from sklearn.metrics import classification_report from sklearn.neighbors import KNeighborsClassifier
from sklearn.tree import DecisionTreeClassifier
from sklearn.naive_bayes import GaussianNB
import os def load_dataset(feature_paths,label_paths):
feature=np.ndarray(shape=(0,41))
label=np.ndarray(shape=(0,1))
for file in feature_paths:
# 使用逗号分隔符读取特征数据,将问号替换标记为缺失值,不包含表头
df=pd.read_table(file,delimiter=',',na_values='?',header=None)
imp=Imputer(missing_values='NaN',strategy='mean',axis=0)
#imp 是一个Imputer实例 用于预处理数据
imp.fit(df)
df=imp.transform(df)
#进行特征合并
feature=np.concatenate((feature,df))
for file in label_paths:
df=pd.read_table(file,header=None)
label=np.concatenate((label,df))
label=np.ravel(label)
return feature,label if __name__=='__main__': os.chdir(r"D:\mechine_learning\mooc_data\bodydata")
feature_paths=['A.feature','B.feature','C.feature','D.feature','E.feature',] #label_paths=['A.label','B.label','C.label']
#x_train,y_train=load_dataset(feature_paths[:2],label_paths[:2])
#x_test,y_test=load_dataset(feature_paths[2:],label_paths[2:])
label_paths=['A.label','B.label','C.label','D.label','E.label',]
x_train,y_train=load_dataset(feature_paths[:4],label_paths[:4])
x_test,y_test=load_dataset(feature_paths[4:],label_paths[4:])
x_train,x_,y_train,y_=train_test_split(x_train,y_train,test_size=0.0) '''
mask=np.random.permutation(x_test.shape[0])[0:10000]
x_test=x_test[mask,:]
y_test=y_test[mask]
x_train,y_train=x_train[0:100000,:],y_train[0:100000]
''' #只是随机打乱
'''
print("Start training knn")
knn=KNeighborsClassifier(algorithm='kd_tree')
knn.fit(x_train,y_train,)
print("begin predic")
answer_knn=knn.predict(x_test)
print("knn are done") print("DT are training")
DT=DecisionTreeClassifier()
DT.fit(x_train,y_train)
print("begin predic")
answer_DT=DT.predict(x_test)
print("DT are done") print("naive bayes are training")
nb=GaussianNB()
nb.fit(x_train,y_train)
print("begin predic")
answer_nb=nb.predict(x_test)
print("naive nb are done!")
print("knn")
print(classification_report(y_test,answer_knn)) print("DT")
print(classification_report(y_test,answer_DT)) print("nb")
print(classification_report(y_test,answer_nb))
'''

股票涨跌预测###

也是一个效果微乎其微的预测

就算只是预测单天是涨是跌,也只能做到53%左右的准确度。

# -*- coding: utf-8 -*-
"""
Created on Fri May 26 18:59:17 2017 @author: sfzyk
"""
import pandas as pd
import numpy as np
from sklearn import svm
from sklearn import cross_validation
import os
os.chdir("D:\mechine_learning\mooc_data\stock") data=pd.read_csv("000777.csv",encoding='gbk',parse_dates=[0],index_col=0)
data.sort_index(0,ascending=True,inplace=True) dayfeature=150
featurenum=5*dayfeature
x=np.zeros((data.shape[0]-dayfeature,featurenum+1))
y=np.zeros((data.shape[0]-dayfeature)) for i in range(0,data.shape[0]-dayfeature):
x[i,0:featurenum]=np.array(data[i:i+dayfeature][['收盘价','最低价','最高价','开盘价','成交量']]).reshape((1,featurenum))
x[i,featurenum]=data.ix[i+dayfeature]['开盘价'] for i in range(0,data.shape[0]-dayfeature):
if data.ix[i+dayfeature]['收盘价']>=data.ix[i+dayfeature]['开盘价']:
y[i]=1
else:
y[i]=0 clf=svm.SVC(kernel='rbf')
result=[]
for i in range(5):
x_train,x_test,y_train,y_test=cross_validation.train_test_split(x,y,test_size=0.2) clf.fit(x_train,y_train) result.append(np.mean(y_test==clf.predict(x_test)))

第二周<导学/分类>的更多相关文章

  1. 第二周<线性回归>

    可行性分析 略 sklearn.linear_model.linear_regression() 一些参数 fit_intercept 布尔型参数,表示是否计算该模型的截距 normalize 布尔型 ...

  2. Surprise团队第二周项目总结

    Surprise团队第二周项目总结 项目进展 已实现五子棋人人模式部分 人人模式: 基本方式:采取黑棋先行,黑白交替的下棋顺序. 模式:通过鼠标点击相应棋盘中的"交叉点",在lay ...

  3. python课程第二周重点记录

    python课程第二周重点记录 1.元组的元素不可被修改,元组的元素的元素可以被修改(字典在元组中,字典的值可以被修改) 2.个人感觉方便做加密解密 3.一些方法的使用 sb = "name ...

  4. 20145213《Java程序设计》第二周学习总结

    20145213<Java程序设计>第二周学习总结 教材学习内容总结 本周娄老师给的任务是学习教材的第三章--基础语法.其实我觉得还蛮轻松的,因为在翻开厚重的书本,一股熟悉的气息扑面而来, ...

  5. 20145304 刘钦令 Java程序设计第二周学习总结

    20145304 <Java程序设计>第2周学习总结 教材学习内容总结 java可区分基本类型和类类型(即参考类型)两大类型系统. 基本类型主要可区分为整数.字节.浮点数.字符与布尔. 整 ...

  6. 20145330孙文馨 《Java程序设计》第二周学习总结

    20145330孙文馨第二周学习总结 第二周相比于第一周对java语言有了深一点的了解,也意识到多敲代码才是学习计算机语言的最好方法. 教材内容总结 类型.变量与运算符 *基本类型 整数(short. ...

  7. 20145337 《Java程序设计》第二周学习总结

    20145337 <Java程序设计>第二周学习总结 教材学习内容总结 Java可分基本类型与类类型: 基本类型分整数(short.int.long).字节(byte).浮点数(float ...

  8. Linux内核设计第二周——操作系统工作原理

    Linux内核设计第二周 ——操作系统工作原理 作者:宋宸宁(20135315) 一.实验过程 图1 执行效果 从图中可以看出,每执行my_ start_ kernel函数两次或一次,my_ time ...

  9. 20169212《Linux内核原理与分析》第二周作业

    <Linux内核原理与分析>第二周作业 这一周学习了MOOCLinux内核分析的第一讲,计算机是如何工作的?由于本科对相关知识的不熟悉,所以感觉有的知识理解起来了有一定的难度,不过多查查资 ...

  10. 20135328信息安全系统设计基础第二周学习总结(vim、gcc、gdb)

    第三周学习笔记 学习计时:共8小时 读书:1 代码:5 作业:1 博客:7 一.学习目标 熟悉Linux系统下的开发环境 熟悉vi的基本操作 熟悉gcc编译器的基本原理 熟练使用gcc编译器的常用选项 ...

随机推荐

  1. HBase与传统关系数据库的对比分析

  2. WINDOWS选择目录SHBrowseForFolder使用方法介绍

    首先介绍一个兼容Unicode和多字节的方法,定义如下头文件: // TString.h; #pragma once #include <string> #ifdef UNICODE ty ...

  3. 如何使用log4j记录日志

    1.下载jar包 http://logging.apache.org/log4j 2.将jar包加入项目 放在lib(没有就创建)下 对已经复制过来的jar包鼠标点击右键,选中BuildPath  - ...

  4. 安装配置git服务

    创建git用户和组 groupadd -g git useradd -md /home/git -g -u git 安装依赖包 yum install curl-devel expat-devel g ...

  5. NVIDIA驱动安装、CUDA安装、cudnn安装

    1.禁用 nouveau 驱动 sudo vim /etc/modprobe.d/nvidia-installer-disable-nouveau.conf 或者 sudo vim /etc/modp ...

  6. 转:Linux fork与vfork的深入分析

    源地址:http://linux.chinaitlab.com/c/831529.html 一)fork的概述 .操作系统对进程的管理,是通过进程表完成的.进程表中的每一个表项,记录的是当前操作系统中 ...

  7. mysql基本笔记之一

    1.创建数据库 CREATE DATABASE admin 2.查看数据库 SHOW DATABASES 3.使用数据库 USE admin 4.创建user表 CREATE TABLE user V ...

  8. spring boot 源码解析11-ConfigurationClassPostProcessor类加载解析

    前言 ConfigurationClassPostProcessor实现了BeanDefinitionRegistryPostProcessor接口,该类会在AbstractApplicationCo ...

  9. TZOJ 3522 Checker Challenge(深搜)

    描述 Examine the 6x6 checkerboard below and note that the six checkers are arranged on the board so th ...

  10. agc003E Sequential operations on Sequence

    题意: 有一个数字串S,初始长度为n,是1 2 3 4 …… n. 有m次操作,每次操作给你一个正整数a[i],你先把S无穷重复,然后把前a[i]截取出来成为新的S. 求m次操作后,每个数字在S中出现 ...