logisticregression

 from numpy import *

 import random

 import time

 st = time.time()

 def loaddata(filename):

     fr = open(''.join([filename, '.txt'])).readlines()

     trainx = [[1] + map(float, line.split()[:-1]) for line in fr] # trainx = [[1,12.2,22.4],[1,22.3,31.2],...]

     trainy = [[float(line.split()[-1])] for line in fr] # trainy = [0,1,1,0,...]

     return trainx, trainy

 def sigmod(z):

     return 1.0 / (1 + exp(-z))

 def optimizaion(trainx, trainy):

     trainxmat = mat(trainx)

     m = len(trainx)

     # beta = [0,0,0]

     beta = ones((len(trainx[0]),1)) # array

     # maxiter

     M = 500

     """

     # error permid

     e =

     """

     """

     for i in xrange(M):

         #if error2sum > e:

         # z = betat.T * x = trainx (matricdoc)* beta = [beta.Tx1,beta.Tx2,...,beta.Txn]

         sigmodz = sigmod(trainxmat * beta)

         # [error_i = yi - sigmod(zi)]

         error = trainy - sigmodz

         # update beta

         beta += alpha * trainxmat.T * error

         print beta

         """

     # random gradascent

     for j in xrange(M):

         for i in xrange(m):

             # per span

             alpha = 0.01 + 4 / (1.0 + i +j)

             randid = random.randint(0, m - 1)

             sigmodz = sigmod(trainxmat[randid] * beta)

             error = trainy[randid] - sigmodz

             beta += alpha * trainxmat[randid].T * error

             #print beta

     return beta

 def logregress(testx, beta):

     if mat(testx) * beta > 0: return [1.0]

     else: return [0.0]

 def main():

     # step 1: loading data...

     print "step 1: loading data..."

     trainx, trainy = loaddata('horseColicTraining')

     testx, testy = loaddata('horseColicTest')

     """

     print 'trainx', trainx

     print 'trainy', trainy

     print 'testx', testx

     print 'testy', testy

     print 'testy[2]',testy[2]

     """

     # step 2: training...

     print "step 2: training..."

     beta = optimizaion(trainx, trainy)

     #print "beta = ",beta

     # step 3: testing...

     print "step 3: testing..."

     numTests = 10; errorSum = 0.0; l = len(testx)

     for j in xrange(numTests):

         errorcount = 0.0

         #print 'the total number is: ',l

         for i in xrange(l):

             if logregress(testx[i], beta) != testy[i]:

                 errorcount += 1

         #print "the number of error is: ", errorcount

         print "the error rate is: ", (errorcount / l)

         errorSum += (errorcount / l)

     print "after %d iterations the average error rate is: %f" %(numTests, errorSum/numTests)

 """

 trainx, trainy = loaddata('testSet')

 print trainy

 optimizaion(trainx, trainy)

 """

 main()

 print "cost time: ", (time.time() - st)

 """ lineregres

         # ssi = sigmod(zi) - sigmod(zi) ** 2

         ss = [sigmodzi - sigmodzi ** 2 for sigmodzi in sigmodz]

         # errssi = errori * ssi

         errss = map(lambda x, y: x * y, error, ss)

         # treri = errssi * trainxi(vector)

         trer = [errss[i] * array(trainx[i]) for i in xrange(m)]

         """

logisticregression的更多相关文章

theano中的logisticregression代码学习
1 class LogisticRegression (object): 2 def __int__(self,...): 3 4 #定义一些与逻辑回归相关的各种函数 5 6 def method1( ...
【deep learning学习笔记】注释yusugomori的LR代码 --- LogisticRegression.h
继续看yusugomori的代码,看逻辑回归.在DBN(Deep Blief Network)中,下面几层是RBM,最上层就是LR了.关于回归.二类回归.以及逻辑回归,资料就是前面转的几篇.套路就是设 ...
【deep learning学习笔记】注释yusugomori的LR代码 --- LogisticRegression.cpp
模型实现代码,关键是train函数和predict函数,都很容易. #include <iostream> #include <string> #include <mat ...
python 10大算法之二 LogisticRegression 笔记
使用的包 import matplotlib.pyplot as plt import pandas as pd import numpy as npfrom sklearn import datas ...
sklearn.linear_model.LogisticRegression参数说明
目录 sklearn.linear_model.LogisticRegression sklearn.linear_model.LogisticRegressionCV sklearn.linear_ ...
基于jieba,TfidfVectorizer,LogisticRegression进行搜狐新闻文本分类
一.简介此文是对利用jieba,word2vec,LR进行搜狐新闻文本分类的准确性的提升,数据集和分词过程一样,这里就不在叙述,读者可参考前面的处理过程经过jieba分词,产生24000条分词结果 ...
python3二元Logistics Regression 回归分析（LogisticRegression）
纲要 boss说增加项目平台分析方法: T检验(独立样本T检验).线性回归.二元Logistics回归.因子分析.可靠性分析根本不懂,一脸懵逼状态,分析部确实有人才,反正我是一脸懵首先解释什么是二 ...
Spark LogisticRegression 逻辑回归之建模
导入包 import org.apache.spark.sql.SparkSession import org.apache.spark.sql.Dataset import org.apache.s ...
Spark LogisticRegression 逻辑回归之简介
LogisticRegression简介
LogisticRegression 和 LogisticRegressionCV
在scikit-learn中,与逻辑回归有关的主要是这3个类.LogisticRegression, LogisticRegressionCV 和logistic_regression_path.其中 ...

随机推荐

loadrunner11 录制脚步不成功，在录制概要出现“No Events were detected”，浮动窗口总是显示“0 Events”,解决办法
打开ie浏览器,菜单栏上的工具----Internet选项---高级选项卡,去掉勾选“启用第三方浏览器扩展”,重启ie即可,重新录制脚本就可以成功. 刚刚开始以为自己解决不了这个问题,还想怎么办呢?一 ...
King's Quest - poj 1904（强连通分量+外挂输入输出）
题意:国王有N个儿子,每个儿子都有很多喜欢的姑娘,官员为每个王子都找了一个姑娘让他们结婚,不过国王不满意,他想知道他的每个儿子都可以和那个姑娘结婚(前提他的儿子必须喜欢那个姑娘) 分析:因为最下面一行 ...
一些提高开发效率的 Category
最近工作陆续生产了一些方便开发的工具类,尽管最终没被收入使用,但不妨碍个人使用,故特此开一篇博文,也记录一些自己踩的坑. UIGestureRecognizer+Block 简单来说,你可以这样使用 ...
javascript动态改变当前页面中元素的状态行为
function Datea() { var timed = document.getElementById('timed'); var t = setInterval(function TDate( ...
DTN学习的一些有用链接
1.DTN研究组,该网站提供了一些代码,有NS2上的实现,也有用java实现的源码. http://www.dtnrg.org/wiki/Code 2.DTN实现的另一个版本,与ONE比较,目前还没用 ...
用微信点单订餐系统打造属于个人的O2O外卖订餐行业商业平台
首先,我不能说我是一个成功的微信达人,我也不能说我是一个优秀的互联网专家.但我就眼下所使用的一套订餐系统来讲.正在逐渐的规划一个餐饮行业的商业圈! 我所使用的系统叫"微铺子订餐系统" ...
MySQL定时备份之使用Linux下的crontab定时备份实例
这篇文章主要介绍了使用Linux下的crontab进行MySQL定时备份的例子,需要的朋友可以参考下复制代码代码如下: ##################################### ...
10 Powerful Apache Modules--reference
Apache is the most popular web server in the world,because it is more efficient than others.Thrust o ...
StarUML中时序图添加小人
转载于 http://blog.csdn.net/longyuhome/article/details/9011629 在看时序图的例子的时候,发现有些的时序图上有小人的图标,可是一些UML工具却没有 ...
HDU3757
题意:一些团队因为任务要去避难所,并且每个避难所必须要有团队在,避难所的数量小于等于团队的数量, 团队去避难所的消耗油量与路程成正比,求解最小耗油量.题目来源:2010 Northeastern Eu ...

logisticregression

logisticregression的更多相关文章

随机推荐

热门专题