R与数据分析旧笔记（十）非线性模型

非线性模型

例子：销售额x与流通费率y

> x=c(1.5,2.8,4.5,7.5,10.5,13.5,15.1,16.5,19.5,22.5,24.5,26.5)
> y=c(7.0,5.5,4.6,3.6,2.9,2.7,2.5,2.4,2.2,2.1,1.9,1.8)
> plot(x,y)

1.直线回归

> lm.1=lm(y~x)
> summary(lm.1)

Call:
lm(formula = y ~ x)

Residuals:
    Min      1Q  Median      3Q     Max 
-0.9179 -0.5537 -0.1628  0.3953  1.6519 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)  5.60316    0.43474  12.889 1.49e-07 ***
x           -0.17003    0.02719  -6.254 9.46e-05 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.7701 on 10 degrees of freedom
Multiple R-squared:  0.7964,    Adjusted R-squared:  0.776 
F-statistic: 39.11 on 1 and 10 DF,  p-value: 9.456e-05

，不理想

2.对数法，

> lm.log=lm(y~log(x))
> summary(lm.log)

Call:
lm(formula = y ~ log(x))

Residuals:
     Min       1Q   Median       3Q      Max 
-0.33291 -0.10133 -0.04693  0.16512  0.34844 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)   7.3639     0.1688   43.64 9.60e-13 ***
log(x)       -1.7568     0.0677  -25.95 1.66e-10 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.2064 on 10 degrees of freedom
Multiple R-squared:  0.9854,    Adjusted R-squared:  0.9839 
F-statistic: 673.5 on 1 and 10 DF,  p-value: 1.66e-10
> plot(x,y);lines(x,fitted(lm.log))

比直线回归拟合效果要好，但还是有不足

3.指数法，

> lm.exp=lm(log(y)~x)
> summary(lm.exp)

Call:
lm(formula = log(y) ~ x)

Residuals:
     Min       1Q   Median       3Q      Max 
-0.18246 -0.10664 -0.01670  0.08079  0.25946 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept)  1.759664   0.075101   23.43 4.54e-10 ***
x           -0.048809   0.004697  -10.39 1.12e-06 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.133 on 10 degrees of freedom
Multiple R-squared:  0.9153,    Adjusted R-squared:  0.9068 
F-statistic:   108 on 1 and 10 DF,  p-value: 1.116e-06

> plot(x,y);lines(x,exp(fitted(lm.exp)))

效果并无太大变化，反而更糟

4.幂函数法，

> lm.pow=lm(log(y)~log(x))
> summary(lm.pow)

Call:
lm(formula = log(y) ~ log(x))

Residuals:
      Min        1Q    Median        3Q       Max 
-0.054727 -0.020805  0.004548  0.024617  0.045896 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)  2.19073    0.02951   74.23 4.81e-15 ***
log(x)      -0.47243    0.01184  -39.90 2.34e-12 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.0361 on 10 degrees of freedom
Multiple R-squared:  0.9938,    Adjusted R-squared:  0.9931 
F-statistic:  1592 on 1 and 10 DF,  p-value: 2.337e-12

> plot(x,y);lines(x,exp(fitted(lm.pow)))

检验结果来看上升了，也通过了假设检验，从图上来看拟合效果非常好

R与数据分析旧笔记（十）非线性模型的更多相关文章

R与数据分析旧笔记（十八完结）因子分析
因子分析因子分析降维的一种方法,是主成分分析的推广和发展是用于分析隐藏在表面现象背后的因子作用的统计模型.试图用最少的个数的不可测的公共因子的线性函数与特殊因子之和来描述原来观测的每一分量因子 ...
R与数据分析旧笔记（十六）基于密度的方法：DBSCAN
基于密度的方法:DBSCAN 基于密度的方法:DBSCAN DBSCAN=Density-Based Spatial Clustering of Applications with Noise 本算法 ...
R与数据分析旧笔记（十五）基于有代表性的点的技术：K中心聚类法
基于有代表性的点的技术:K中心聚类法基于有代表性的点的技术:K中心聚类法算法步骤随机选择k个点作为"中心点" 计算剩余的点到这个k中心点的距离,每个点被分配到最近的中心点组成 ...
R与数据分析旧笔记（十四）动态聚类：K-means
动态聚类:K-means方法动态聚类:K-means方法算法选择K个点作为初始质心将每个点指派到最近的质心,形成K个簇(聚类) 重新计算每个簇的质心重复2-3直至质心不发生变化 kmeans ...
R与数据分析旧笔记（十二）分类（支持向量机）
支持向量机(SVM) 支持向量机(SVM) 问题的提出:最优分离平面(决策边界) 优化目标决策边界边缘距离最远数学模型问题转化为凸优化拉格朗日乘子法--未知数太多 KKT变换和对偶公式问题的 ...
R与数据分析旧笔记（十一）数据挖掘初步
PART 1 PART 1 传统回归模型的困难 1.为什么一定是线性的?或某种非线性模型? 2.过分依赖于分析者的经验 3.对于非连续的离散数据难以处理网格方法 <Science>上的文 ...
R与数据分析旧笔记（⑦）回归诊断
回归诊断回归诊断 1.样本是否符合正态分布假设? 2.是否存在离群值导致模型发生较大误差? 3.线性模型是否合理? 4.误差是否满足独立性.等方差.正态分布等假设条件? 5.是否存在多重共线性正态 ...
R与数据分析旧笔记（五）数学分析基本
R语言的各种分布函数 rnorm(n,mean=0,sd=1)#高斯(正态) rexp(n,rate=1)#指数 rgamma(n,shape,scale=1)#γ分布 rpois(n,lambda) ...
R与数据分析旧笔记（三）不知道取什么题目
连线图 > a=c(2,3,4,5,6) > b=c(4,7,8,9,12) > plot(a,b,type="l") 多条曲线效果 plot(rain$Toky ...

随机推荐

hadoop中汉字与英文字符混合的keyword做为combine的key的问题
近期,须要将汉字与字符的非常合串作为combine的输出的key, 这样做是希望,利用hadoop的归并来依照key进行分组,然后,在reduce阶段,拿到的都是一个一个组. 可是,发现,这样的,汉字 ...
centos防火墙端口配置
增加防火墙配置,允许8080端口: # vi /etc/sysconfig/iptables 在允许ssh的下面增加一条: -A INPUT -m state --state NEW -m tcp - ...
FAQ：win7和win8 64位注册ocx控件方法
win7/win8 问题所在: 64位的系统一般都是可以安装32位程序的, 执行 C:\Windows\SysWOW64\regsvr32.exe 而不是 C:\Windows\Sys ...
20151210--MVC
package com.hanqi; import java.io.IOException; import java.sql.*; import java.text.SimpleDateFormat; ...
Twisted No module named win32api
安装twisted成功后,使用时抛错: No module named win32api 解决方案,需要安装 pywin32 下载地址: https://sourceforge.net/project ...
placeholder颜色
::-moz-placeholder{color:#b9bfc1;} // Firefox::-webkit-input-placeholder{color:#b9bfc1;} // Chrome, ...
CentOS下Mysql安装调试
一.安装 yum安装:yum install -y mysql-server mysql mysql-devel 设置自启动:chkconfig mysqld on 启动MySQL:service ...
全角和半角相互转换(C语言实现)
目前,我们接触的汉字编码主要包括GBK和GB2312.其中,GB2312又称国标码,它是一个简化字的编码规范,也包括其他的符号.字母.日文假名等,共7445个图形字符,其中汉字占6763个.我们平时说 ...
製程能力介紹(SPC introduction) ─ 製程能力的三種表示法
製程能力的三種表示法 Ck: 準度指標 (accuracy) Ck=(M-X)/(T/2) Cp: 精度指標 (precision) Cp=T/(6σp) 規格為單邊時:Cp=(Tu-X)/3 ...
TF卡速度测试对比 Class数越高速度越快
存储卡(TF卡)是手机扩展存储的大杀器,让你多装n部学习资料,多装n个外语听力练习.除了装东西外,存储卡性能不佳也会影响手机的整体性能以及体验的.本文主要针对Android手机,我是懒人,但我讨厌懒人 ...

R与数据分析旧笔记（十）非线性模型

非线性模型

例子：销售额x与流通费率y

1.直线回归

2.对数法，

比直线回归拟合效果要好，但还是有不足

3.指数法，

效果并无太大变化，反而更糟

4.幂函数法，

R与数据分析旧笔记（十）非线性模型的更多相关文章

随机推荐

热门专题