python多分类预测模版，输出支持度，多种分类器，str的csv转float

预测结果为1到11中的1个

首先加载数据，训练数据，训练标签，预测数据，预测标签：

if __name__=="__main__":  

    importTrainContentdata()

    importTestContentdata()

    importTrainlabeldata()

    importTestlabeldata()

traindata = []

testdata = []

trainlabel = []

testlabel = []

def importTrainContentdata():

    file = 'F:/goverment/myfinalcode/train_big.csv'

    fo=open(file)

    ls=[]

    for line in fo:

        line=line.replace("\t",",")

        line=line.replace("\n",",")

        line=line.replace("\"",",")

        ls.append(line.split(","))

    for i in ls:

        li=[]

        for j in i:

            if j == '':

                continue

            li.append(float(j))

        traindata.append(li)

def importTestContentdata():

    file = 'F:/goverment/myfinalcode/test_big.csv'

    fo=open(file)

    ls=[]

    for line in fo:

        line=line.replace("\t",",")

        line=line.replace("\n",",")

        line=line.replace("\"",",")

        ls.append(line.split(","))

    for i in ls:

        li=[]

        for j in i:

            if j == '':

                continue

            li.append(float(j))

        testdata.append(li)   

#导入类别的训练和测试数据

def importTrainlabeldata():

    file = 'F:/goverment/myfinalcode/train_big_label.xls'

    wb = xlrd.open_workbook(file)

    ws = wb.sheet_by_name("Sheet1")

    for r in range(ws.nrows):

        col = []

        for c in range(1):

            col.append(ws.cell(r, c).value)

        trainlabel.append(col)

def importTestlabeldata():

    file = 'F:/goverment/myfinalcode/test_big_label.xls'

    wb = xlrd.open_workbook(file)

    ws = wb.sheet_by_name("Sheet1")

    for r in range(ws.nrows):

        col = []

        for c in range(1):

            col.append(ws.cell(r, c).value)

        testlabel.append(col)

其中训练数据，预测数据是csv文件格式，而且是str，要转为float并一排排放入lis，然后将所有lis放入traindata或testdata中，但csv中是以","隔开的，所以要将"\t"等都转为","，需要利用

ls.append(line.split(","))放入ls中，但仍然是str型的，我又另外转化成了float，后来发
现不转化也是可以的，可能它后来会在即转化吧。

之后运用多种分类器，调参数参考
http://scikit-learn.org/stable/supervised_learning.html#supervised-learning 然后选出尽量好的分类器，提高准确率

 '''

    #19%

    from sklearn import neighbors

    knn=neighbors.KNeighborsClassifier(n_neighbors=75, leaf_size=51, weights='distance',p=2)

    knn.fit(traindata, trainlabel)

    predict=knn.predict(testdata)

    '''

    '''

    #这个不行

    from sklearn.neural_network import MLPClassifier

    import numpy as np

    traindata = np.array(traindata)#TypeError: cannot perform reduce with flexible type

    traindata = traindata.astype(float)

    trainlabel = np.array(trainlabel)

    trainlabel = trainlabel.astype(float)

    testdata=np.array(testdata)

    testdata = testdata.astype(float)

    model=MLPClassifier(activation='relu', alpha=1e-05, batch_size='auto',

       beta_1=0.9, beta_2=0.999, early_stopping=False,

       epsilon=1e-08, hidden_layer_sizes=(5, 2), learning_rate='constant',

       learning_rate_init=0.001, max_iter=200, momentum=0.9,

       nesterovs_momentum=True, power_t=0.5, random_state=1, shuffle=True,

       solver='lbfgs', tol=0.0001, validation_fraction=0.1, verbose=False,

       warm_start=False)

    model.fit(traindata, trainlabel)

    predict = model.predict(testdata)

    '''

    '''

    #19%

    from sklearn.tree import DecisionTreeClassifier

    model=DecisionTreeClassifier(class_weight='balanced',max_features=68,splitter='best',random_state=5)

    model.fit(traindata, trainlabel)

    predict = model.predict(testdata)

    这个不行

    from sklearn.naive_bayes import MultinomialNB

    clf = MultinomialNB(alpha=0.052).fit(traindata, trainlabel)

    #clf.fit(traindata, trainlabel)

    predict=clf.predict(testdata)

    '''

    '''17%

    from sklearn.svm import SVC

    clf = SVC(C=150,kernel='rbf', degree=51, gamma='auto',coef0=0.0,shrinking=False,probability=False,tol=0.001,cache_size=300, class_weight=None,verbose=False,max_iter=-1,decision_function_shape=None,random_state=None)

    clf.fit(traindata, trainlabel)

    predict=clf.predict(testdata)

    '''

    '''0.5%

    from sklearn.naive_bayes import GaussianNB

    import numpy as np

    gnb = GaussianNB()

    traindata = np.array(traindata)#TypeError: cannot perform reduce with flexible type

    traindata = traindata.astype(float)

    trainlabel = np.array(trainlabel)

    trainlabel = trainlabel.astype(float)

    testdata=np.array(testdata)

    testdata = testdata.astype(float)

    predict = gnb.fit(traindata, trainlabel).predict(testdata)

    '''

    '''16%

    from sklearn.naive_bayes import BernoulliNB

    import numpy as np

    gnb = BernoulliNB()

    traindata = np.array(traindata)#TypeError: cannot perform reduce with flexible type

    traindata = traindata.astype(float)

    trainlabel = np.array(trainlabel)

    trainlabel = trainlabel.astype(float)

    testdata=np.array(testdata)

    testdata = testdata.astype(float)

    predict = gnb.fit(traindata, trainlabel).predict(testdata)

    '''

    from sklearn.ensemble import RandomForestClassifier

    forest = RandomForestClassifier(n_estimators=500,random_state=5, warm_start=False, min_impurity_decrease=0.0,min_samples_split=15)  # 生成随机森林多分类器

    predict = forest.fit(traindata, trainlabel).predict(testdata)

输出准确率，我还把预测结果输出到txt中，方便分析。

s=len(predict)

    f=open('F:/goverment/myfinalcode/predict.txt', 'w')

    for i in range(s):

       f.write(str(predict[i]))

       f.write('\n')

    f.write("写好了")

    f.close()

    k=0

    print(s)

    for i in range(s):

        if testlabel[i] == predict[i]:

            k=k+1

    print("精度为:",k*1.0/s)

接下来是输出所有标签的支持度

    print('我要开始输出支持度啦')

    attribute_proba=forest.predict_proba(testdata)

    #print(forest.predict_proba(testdata))#输出各个标签的概率

    print(type(attribute_proba))

    import xlwt

    myexcel = xlwt.Workbook()

    sheet = myexcel.add_sheet('sheet')

    si=-1

    sj=-1

    for i in attribute_proba:

        si=si+1

        for j in i:

            sj=sj+1

            sheet.write(si,sj,str(j))

        sj=-1

    myexcel.save("attribute_proba_small.xls")

运行结果如下：

但是这样还不够，我还要输出前3个的预测结果的编号和支持度。
我开了个类attri，key用来放编号，weight则放支持度。
之后对每一条记录的所有的预测概率（支持度）遍历3次。每次找出概率最大的一个，挑出后把编号和
概率存好，并把这个值变为0，再寻找挑出最大的一个，循环3次。存好后输出到excel

    '''接下来输出每组概率最大的四个的编号'''

    class attri:

        def __init__(self):

            self.key=0

            self.weight=0.0

    label=[]

    for i in attribute_proba:

        lis=[]

        k=0

        while k<3:

            k=k+1

            p=1

            mm=0

            sj=-1

            for j in i:

                sj=sj+1

                if j>mm:

                    mm=j

                    p=sj

            i[p]=0#难道是从1开始？我一开始写了i【p-1】但debug时发现不对

            a=attri()

            a.key=p

            a.weight=mm

            lis.append(a)

        label.append(lis)

    print('挑几个输出')

    import xlwt

    myexcel = xlwt.Workbook()

    sheet = myexcel.add_sheet('sheet')

    si=-2

    sj=-1

    for i in label:

        si=si+2

        for j in i:

            sj=sj+1

            sheet.write(si,sj,str(j.key))

            sheet.write(si+1,sj,str(j.weight))

        sj=-1

    myexcel.save("proba_big.xls")

运行结果如下：

自学得真辛苦啊，这些都是我的学习成果，准确还是可以在提高的，对你有帮助的话，点个赞吧，嘿嘿。

python多分类预测模版，输出支持度，多种分类器，str的csv转float的更多相关文章

R_Studio(关联)使用apriori函数简单查看数据存在多少条关联规则，并按支持度降序排序输出
查看数据menu_orders.txt文件存在多少条关联规则,并按支持度降序排序输出 #导入arules包 install.packages("arules") library ( ...
分类预测输出precision，recall，accuracy，auc和tp，tn，fp，fn矩阵
此次我做的实验是二分类问题,输出precision,recall,accuracy,auc # -*- coding: utf-8 -*- #from sklearn.neighbors import ...
使用LIBSVM工具实现样本分类预测——MatLab
准备工作: https://www.csie.ntu.edu.tw/~cjlin/libsvm/,下载LIBSVM:(LIBSVM工具相较于MATLAB自带的工具:1).支持多分类及回归(‘-s 0’ ...
【机器学习具体解释】SVM解二分类,多分类,及后验概率输出
转载请注明出处:http://blog.csdn.net/luoshixian099/article/details/51073885 CSDN−勿在浮沙筑高台支持向量机(Support Vecto ...
贝叶斯--旧金山犯罪分类预测和电影评价好坏 demo
来源引用:https://blog.csdn.net/han_xiaoyang/article/details/50629608 1.引言贝叶斯是经典的机器学习算法,朴素贝叶斯经常运用于机器学习的案 ...
读论文《BP改进算法在哮喘症状-证型分类预测中的应用》
总结: 一.研究内容本文研究了CAL-BP(基于隐层的竞争学习与学习率的自适应的改进BP算法)在症状证型分类预测中的应用. 二.算法思想 1.隐层计算完各节点的误差后,对有最大误差的节点的权值进行正 ...
13、Selenium+python+API分类总结
Selenium+python+API分类总结 http://selenium-python.readthedocs.org/index.html 分类方法方法描述客户端操作 __init__( ...
【每日一个小技巧】Python | input的提示信息换行输出，提示信息用变量表示
[每日一个小技巧]Python | input的提示信息换行输出,提示信息用变量表示在书写代码的途中,经常会实现这样功能: 请输入下列选项前的序号: 1.选择1 2.选择2 3.选择3 在pytho ...
使用BERT进行情感分类预测及代码实例
文章目录 0. BERT介绍 1. BERT配置 1.1. clone BERT 代码 1.2. 数据处理 1.2.1预训练模型 1.2.2数据集训练集测试集开发集 2. 修改代码 2.1 加入 ...

随机推荐

LeetCode OJ：Implement Trie (Prefix Tree)（实现一个字典树(前缀树)）
Implement a trie with insert, search, and startsWith methods. 实现字典树,前面好像有道题做过类似的东西,代码如下: class TrieN ...
【javascript基础】 JavaScript defer和async区别
defer该属性用来通知浏览器,这段脚本代码将不会产生任何文档内容.例如 JavaScript代码中的document.write()方法将不会骑作用,浏览器遇到这样的代码将会忽略,并继续执行后面的代 ...
Conky配置文件
Conky是一个可以在linux系统中实时显示系统性能的工具,美观且十分好用,我们选择安装conky-all程序包 # set to yes if you want Conky to be forke ...
jquery.lazyload.js 图片延迟加载
当做网页的时候,特别是整个网页展示图片较多的时候,用到图片延迟效果是很好的使用方法也非常简单. 1.在网页任何位置(一般是在</body>前面)加上如下代码(注意<script&g ...
.NET中，在方法参数的类型前加一个OUT是做什么用的
话说古时候,在一个名字叫C#的繁华的大城市里面,有两家珠宝加工店,一家叫ref,另外一家叫out. 有一天,有名字叫a和b的两个人每人都各带了一公斤黄金要加工首饰. a去了ref店,ref的掌柜告诉a ...
ASP.NET后台怎么输出方法中间调试信息?
后台方法,不止是aspx.cs,而是页面调用的一些其它方法.想调试这些方法,我以前winform都是MessageBox.Show一些中间结果,现在我也想用这种方式.但想想,网页会触发 Message ...
深度学习（六十四）Faster R-CNN物体检测
js 由快到慢的执行
let t=0; for(var i=0;i<len;i++){ (function (t) { $timeout(function(){ console.log(t); },t); })(t) ...
object references an unsaved transient instance - save the transient instance before flushing: com.jspxcms.core.domain.ScTeam
object references an unsaved transient instance - save the transient instance before flushing: com.j ...
BZOJ1087 SCOI2005 互不侵犯King 【状压DP】
BZOJ1087 SCOI2005 互不侵犯King Description 在N×N的棋盘里面放K个国王,使他们互不攻击,共有多少种摆放方案.国王能攻击到它上下左右,以及左上左下右上右下八个方向上附 ...

python多分类预测模版，输出支持度，多种分类器，str的csv转float

python多分类预测模版，输出支持度，多种分类器，str的csv转float的更多相关文章

随机推荐

热门专题