Python使用逻辑回归估算OR值

第一种是统计学方法，需要用到 statsmodels包

　　statsmodels是统计和计量经济学的package，包含了用于参数评估和统计测试的实用工具

第二种是机器学习，需要使用sklearn中的LogisticRegression

下面以计算dis1-->dis2的OR值为例，也就是说dis1为自变量，dis2为因变量

首先我们先造一组数据： x为自变量，y为因变量

df = pd.DataFrame({'x': ['dis1', 'dis1', 'dis1', 'dis1', 'dis3', 'dis3', 'dis3', 'dis3'], 'y': ["dis2", "dis2",

"dis2", "dis4", "dis4", "dis4", "dis4", "dis2"]})

因为我要使用逻辑回归估计OR值，所以首先会计算出实际的OR值

	患dis2	不患dis2
患dis1	A	B
不患dis1	C	D

OR值的计算:OR_dis1_dis2 = AD/BC,其中A = 3, B = 1, C = 1, D = 3

ct = pd.crosstab(df.x, df.y)

oddsratio, pvalue = stats.fisher_exact(ct)

使用stamodel包中的逻辑回归进行OR值的估计：

df["intercept"] = 1.0  # 截距项，初始化截距项，不可省

# 拟合模型

logit = sm.Logit(df['y'], df[df.columns[1:]])

result = logit.fit()

print(result.summary())

# 计算得到OR值

OR1 = np.exp(result.params)

使用机器学习方法计算OR

df = pd.get_dummies(df)

clf = LogisticRegression(penalty='none')

clf.fit(df[['x_dis1']], df[['y_dis2']].values)

print(clf)

odds_ratio = np.exp(clf.coef_)

print(odds_ratio)

完整代码：

import pandas as pd

import statsmodels.api as sm

from sklearn.linear_model import LogisticRegression

import numpy as np

# 构造数据

df = pd.DataFrame({'x': ['dis1', 'dis1', 'dis1', 'dis1', 'dis3', 'dis3', 'dis3', 'dis3'], 'y': ["dis2", "dis2",

"dis2", "dis4", "dis4", "dis4", "dis4", "dis2"]})

# 计算实际OR

ct = pd.crosstab(df.x, df.y)

oddsratio, pvalue = stats.fisher_exact(ct)

# 使用统计学方法计算

df["intercept"] = 1.0  # 截距项，初始化截距项，不可省

# 拟合模型

logit = sm.Logit(df['y'], df[df.columns[1:]])

result = logit.fit()

print(result.summary())

# 计算得到OR值

OR1 = np.exp(result.params)

# 使用机器学习方法计算

df = pd.get_dummies(df)

clf = LogisticRegression(penalty='none')

clf.fit(df[['x_dis1']], df[['y_dis2']].values)

print(clf)

odds_ratio = np.exp(clf.coef_)

print(odds_ratio)

Python使用逻辑回归估算OR值的更多相关文章

机器学习_线性回归和逻辑回归_案例实战：Python实现逻辑回归与梯度下降策略_项目实战：使用逻辑回归判断信用卡欺诈检测
线性回归: 注:为偏置项,这一项的x的值假设为[1,1,1,1,1....] 注:为使似然函数越大,则需要最小二乘法函数越小越好线性回归中为什么选用平方和作为误差函数?假设模型结果与测量值误差满足 ...
机器学习之使用Python完成逻辑回归
一.任务基础我们将建立一个逻辑回归模型来预测一个学生是否被大学录取.假设你是一个大学系的管理员,你想根据两次考试的结果来决定每个申请人的录取机会.你有以前的申请人的历史数据,你可以用它作为逻辑回归的 ...
Python之逻辑回归模型来预测
建立一个逻辑回归模型来预测一个学生是否被录取. import numpy as np import pandas as pd import matplotlib.pyplot as plt impor ...
python机器学习-逻辑回归
1.逻辑函数假设数据集有n个独立的特征,x1到xn为样本的n个特征.常规的回归算法的目标是拟合出一个多项式函数,使得预测值与真实值的误差最小: 而我们希望这样的f(x)能够具有很好的逻辑判断性质,最 ...
python机器学习——逻辑回归
我们知道感知器算法对于不能完全线性分割的数据是无能为力的,在这一篇将会介绍另一种非常有效的二分类模型--逻辑回归.在分类任务中,它被广泛使用逻辑回归是一个分类模型,在实现之前我们先介绍几个概念: 几 ...
python实现逻辑回归
首先得明确逻辑回归与线性回归不同,它是一种分类模型.而且是一种二分类模型. 首先我们需要知道sigmoid函数,其公式表达如下: 其函数曲线如下: sigmoid函数有什么性质呢? 1.关于(0,0. ...
吴裕雄 python 机器学习——逻辑回归
import numpy as np import matplotlib.pyplot as plt from matplotlib import cm from mpl_toolkits.mplot ...
用python实现逻辑回归
机器学习课程的一个实验,整理出来共享. 原理很简单,优化方法是用的梯度下降.后面有测试结果. # coding=utf-8 from math import exp import matplotlib ...
Python之逻辑回归
代码: import numpy as np from sklearn import datasets from sklearn.linear_model import LogisticRegress ...

随机推荐

WPF绘制图表-LiveCharts
LiveCharts是一款非常好用的WPF图表绘制类库,相比其他同类类库,LiveCharts的UI风格样式更加多样更加美观. 准备工作:安装以下两个类库: 1.甘特图前台View代码 1 < ...
二级py--day2
二级py day2-3 1.进程至少活动情况分为:运行状态.就绪状态.等待状态(阻塞状态).创建状态.终止状态 2.进程的特性包括: 并发性和动态性 3.计算机地址位数决定了内存的最大容量,决定了虚拟 ...
超强视频超分AI算法，从此只看高清视频
最近发现一个特别强的视频超分算法----BasicVSR,在真实世界数据集中,实现了前所未有的视觉重建效果,最近它还拿下了超分比赛NTIRE 2021三冠一亚的优异成绩,登上了CVPR 2022. 视 ...
laravel 返回值
先理解几个概念: StdClass 对象 => 基础的对象 Eloquent 模型对象 (Model 对象) => 和模型相关的类对象 Eloquent 集合 => 可以简单理解为对 ...
Excel用Power Query把文件夹下所有文件合并为一个与合并多个表格
Excel用Power Query把文件夹下所有文件合并为一个与合并多个表格在 Excel Power Query 未出来之前,把文件夹下所有文件合并为一个与合并同一工作表中的多个工作表,需要用 V ...
七天接手react项目 —— state&事件处理&ref
state&事件处理&ref 在 react 起步一文中,我们学习了 react 相关知识:jsx.组件.props.本篇将继续研究 state.事件处理和ref. state St ...
微信小程序实现简单的2048
这两天心血来潮,用微信小程序写了一个简单的2048,欢迎各位老铁围观,提出宝贵意见.这里我从0到1赘述一下个人实现流程: 首先去微信公平台(https://mp.weixin.qq.com/)注册一个 ...
1354：括弧匹配检验ybt
[题目描述]假设表达式中允许包含两种括号:圆括号和方括号,其嵌套的顺序随意,如(［］())或［(［］［］)］等为正确的匹配,［( ］)或(［］( )或 ( ( ) ) )均为错误的匹配. 现在 ...
在kali中安装两个版本的python
在kali中安装两个版本的python 在kali中已经预装了两个版本的python,但是没有装pip(>︿<). 这时使用python或者python3表示python3:使用pytho ...
TypeScript 初体验
TypeScript学习 1 安装环境 a 首先安装node.js node.js 用来将ts文件解析成js文件供浏览器使用: 解析ts文件 tsc filename.ts b. 使用npm (no ...

Python使用逻辑回归估算OR值

Python使用逻辑回归估算OR值的更多相关文章

随机推荐

热门专题