kaggle之手写体识别

数据预览

首先载入数据集

import pandas as pd

import numpy as np

train = pd.read_csv('/Users/frank/Documents/workspace/kaggle/dataset/digit_recognizer/train.csv')

test = pd.read_csv('/Users/frank/Documents/workspace/kaggle/dataset/digit_recognizer/test.csv')

print train.head()

print test.head()

   label  pixel0  pixel1  pixel2  pixel3  pixel4  pixel5  pixel6  pixel7  \

0      1       0       0       0       0       0       0       0       0

1      0       0       0       0       0       0       0       0       0

2      1       0       0       0       0       0       0       0       0

3      4       0       0       0       0       0       0       0       0

4      0       0       0       0       0       0       0       0       0   

   pixel8    ...     pixel774  pixel775  pixel776  pixel777  pixel778  \

0       0    ...            0         0         0         0         0

1       0    ...            0         0         0         0         0

2       0    ...            0         0         0         0         0

3       0    ...            0         0         0         0         0

4       0    ...            0         0         0         0         0   

   pixel779  pixel780  pixel781  pixel782  pixel783

0         0         0         0         0         0

1         0         0         0         0         0

2         0         0         0         0         0

3         0         0         0         0         0

4         0         0         0         0         0  

[5 rows x 785 columns]

   pixel0  pixel1  pixel2  pixel3  pixel4  pixel5  pixel6  pixel7  pixel8  \

0       0       0       0       0       0       0       0       0       0

1       0       0       0       0       0       0       0       0       0

2       0       0       0       0       0       0       0       0       0

3       0       0       0       0       0       0       0       0       0

4       0       0       0       0       0       0       0       0       0   

   pixel9    ...     pixel774  pixel775  pixel776  pixel777  pixel778  \

0       0    ...            0         0         0         0         0

1       0    ...            0         0         0         0         0

2       0    ...            0         0         0         0         0

3       0    ...            0         0         0         0         0

4       0    ...            0         0         0         0         0   

   pixel779  pixel780  pixel781  pixel782  pixel783

0         0         0         0         0         0

1         0         0         0         0         0

2         0         0         0         0         0

3         0         0         0         0         0

4         0         0         0         0         0  

[5 rows x 784 columns]

分离训练数据和标签：

train_data = train.values[:,1:]

label = train.ix[:,0]

test_data = test.values

使用PCA来降维：PCA文档

使用SVM来训练：SVM文档

降维

from sklearn.decomposition import PCA

from sklearn.svm import SVC

pca = PCA(n_components=0.8, whiten=True)

# pca.fit(train_data)

train_data = pca.fit_transform(train_data)

# pca.fit(test_data)

test_data = pca.transform(test_data)

SVM训练

print('使用SVM进行训练...')

svc = SVC(kernel='rbf',C=2)

svc.fit(train_data, label)

print('训练结束.')

使用SVM进行训练...

训练结束.

print('对测试集进行预测...')

predict = svc.predict(test_data)

print('预测结束.')

对测试集进行预测...

预测结束.

保存结果：

pd.DataFrame(

    {"ImageId": range(1, len(predict) + 1), "Label": predict}

).to_csv('output.csv', index=False, header=True)

print 'done.'

done.

kaggle之手写体识别的更多相关文章

pytorch实现kaggle猫狗识别
参考:https://blog.csdn.net/weixin_37813036/article/details/90718310 kaggle是一个为开发商和数据科学家提供举办机器学习竞赛.托管数据 ...
MXNET手写体识别的例子
安装完MXNet之后,运行了官网的手写体识别的例子,这个相当于深度学习的Hello world了吧.. http://mxnet.io/tutorials/python/mnist.html 运行的过 ...
libsvm Minist Hog 手写体识别
统计手写数字集的HOG特征转载请注明出处,楼燚(yì)航的blog,http://www.cnblogs.com/louyihang-loves-baiyan/ 这篇文章是模式识别的小作业,利用sv ...
Python3实现简单可学习的手写体识别
0.目录 1.前言 2.通过pymssql与数据库的交互 3.通过pyqt与界面的交互 4.UI与数据库的交互 5.最后的main主函数 1.前言版本:Python3.6.1 + PyQt5 + S ...
R︱Softmax Regression建模 (MNIST 手写体识别和文档多分类应用)
本文转载自经管之家论坛, R语言中的Softmax Regression建模 (MNIST 手写体识别和文档多分类应用) R中的softmaxreg包,发自2016-09-09,链接:https:// ...
keras入门--Mnist手写体识别
介绍如何使用keras搭建一个多层感知机实现手写体识别及搭建一个神经网络最小的必备知识 import keras # 导入keras dir(keras) # 查看keras常用的模块 ['Input ...
使用KNN算法手写体识别
#!/usr/bin/python #coding:utf-8 import numpy as np import operator import matplotlib import matplotl ...
深度学习-mnist手写体识别
mnist手写体识别 Mnist数据集可以从官网下载,网址: http://yann.lecun.com/exdb/mnist/ 下载下来的数据集被分成两部分:55000行的训练数据集(mnist.t ...
入门项目数字手写体识别：使用Keras完成CNN模型搭建（重要）
摘要: 本文是通过Keras实现深度学习入门项目——数字手写体识别,整个流程介绍比较详细,适合初学者上手实践. 对于图像分类任务而言,卷积神经网络(CNN)是目前最优的网络结构,没有之一.在面部识别. ...

随机推荐

执行curl -sSL 提示curl: (35) SSL connect error
今天,添加容器节点报错,执行如下 curl -sSL https://shipyard-project.com/deploy| ACTION=node DISCOVERY=etcd://192.168 ...
Java数据输入
以下是数据输入实例: //以下是数据输入实例 import java.util.Scanner;//导入java.util.Scanner,Scanner首字母大写 public class Test ...
unity 之2D游戏简单操作
unity 做2D项目也很方便. 首先要调整camera的模式,camera 的检视面板参数如下: perspective 模式就是平时用的模式.摄像机到游戏物体是有角度的张开, 而 orthog ...
java内部类实现多继承
class Example1 { public String name() { return "liutao"; } } class Example2 { public int a ...
CSS3 基础知识
CSS3 基础知识1.边框 1.1 圆角 border-radius:5px 0 0 5px; 1.2 阴影 box-shadow:2px 3px 4px 5px rgba(0,0,0 ...
ecshop中404错误页面设置
在ecshop系统当中,比如你随意将商品详细页面的地址中的ID修改为一个不存在的商品ID,ecshop会自动跳转到首页.ecshop在这方面做得非常的差,甚至导致了很多的站不被搜索引擎收录.最模板提供 ...
javascript区分电脑与手机登陆
<script language="javascript"> function checkMobile() { var pda_user_agent_list = ne ...
iOS学习之详解AppDelegate
AppDelegate, 类似于监听接口. 用个很简单的例子说:ios系统会控制每个程序的开始和结束.但是ios又不知道每个程序的开始需要运行成么代码,结束需要运行什么代码.这个时候,ios就制定了一 ...
hdu 1595 find the longest of the shortest
http://acm.hdu.edu.cn/showproblem.php?pid=1595 这道题我用spfa在枚举删除边的时候求最短路超时,改用dijkstra就过了. #include < ...
BZOJ 3550 Vacation
http://www.lydsy.com/JudgeOnline/problem.php?id=3550 题意:有3N个数,你需要选出一些数,首先保证任意长度为N的区间中选出的数的个数<=K个, ...

kaggle之手写体识别

数据预览

降维

SVM训练

kaggle之手写体识别的更多相关文章

随机推荐

热门专题