本文首发于“生信补给站”公众号,https://mp.weixin.qq.com/s/TqFk66F2gUu_k8WEjKbLtA 更多关于R语言,ggplot2绘图,生信分析的内容,敬请关注小号. lm/glm/t.test/chisq.test等模型结果,怎么提?复制粘贴还是broom? 一 载入数据及R包 1.1 mtcars数据集 #载入内置数据集mtcarshead(mtcars)                   mpg cyl disp  hp drat    wt  qsec…
当训练好一个model之后,我们通常会根据这个model最终的loss和在验证集上的accuracy来判断它的好坏.但是,对于分类问题,我们如果只是知道整体的分类正确率 显然还不够,所以只有知道模型对于每一类的分类结果以及正确率这样才能更好的理解这个模型. 下面就是一个用训练好的模型,来对测试集进行测试,并输出每个样本的分类结果的实现. 代码如下: #coding=utf-8 import os import caffe import numpy as np root='/home/liuyun…
以下代码实现功能: 1.获取10个模型分别使用哪些变量 2.变量所模型使用的次数 3.把上表格输出到EXCEL中 %INCLUDE '00@HEADER.SAS'; %let dir=..\04@Model; libname cc "&dir"; PROC FORMAT; VALUE UseFmt 1='使用' 0='未使用' OTHER='其它' ;RUN; PROC DATASETS LIBRARY=S NODETAILS NOLIST; DELETE ModelVaria…
函数说明 1.LDA(n_topics, max_iters, random_state)  用于构建LDA主题模型,将文本分成不同的主题 参数说明:n_topics 表示分为多少个主题, max_iters表示最大的迭代次数, random_state 表示随机种子 2. LDA.components_ 打印输入特征的权重参数, LDA主题模型:可以用于做分类,好比如果是两个主题的话,那就相当于是分成了两类,同时我们也可以找出根据主题词的权重值,来找出一些主题的关键词 使用sklearn导入库…
一.BERT整体结构 BERT主要用了Transformer的Encoder,而没有用其Decoder,我想是因为BERT是一个预训练模型,只要学到其中语义关系即可,不需要去解码完成具体的任务.整体架构如下图: 多个Transformer Encoder一层一层地堆叠起来,就组装成了BERT了,在论文中,作者分别用12层和24层Transformer Encoder组装了两套BERT模型,两套模型的参数总数分别为110M和340M. 二.再次理解Transformer中的Attention机制…
from keras.datasets import mnist (train_images, train_labels), (test_images, test_labels) = mnist.load_data() #train_images 和 train_labels 是训练集 train_images.shape#第一个数字表示图片张数,后面表示图片尺寸,和之前我在opencv上遇到的有所不同 #opencv上是前面表示图片尺寸,后面表示图片的通道数量 输出: (60000, 28,…
一.模型假设 传统多元线性回归模型 最重要的假设的原理为: 1. 自变量和因变量之间存在多元线性关系,因变量y能够被x1,x2-.x{k}完全地线性解释:2.不能被解释的部分则为纯粹的无法观测到的误差 其它假设主要为: 1.模型线性,设定正确: 2.无多重共线性: 3.无内生性: 4.随机误差项具有条件零均值.同方差.以及无自相关: 5.随机误差项正态分布 具体见另一篇文章:回归模型的基本假设 二.估计方法 目标:估计出多元回归模型的参数 注:下文皆为矩阵表述,X为自变量矩阵(n*k维),y为因…
什么是 ARIMA模型 ARIMA模型的全称叫做自回归移动平均模型,全称是(ARIMA, Autoregressive Integrated Moving Average Model).也记作ARIMA(p,d,q),是统计模型(statistic model)中最常见的一种用来进行时间序列 预测的模型. 1. ARIMA的优缺点 优点: 模型十分简单,只需要内生变量而不需要借助其他外生变量. 缺点: 1.要求时序数据是稳定的(stationary),或者是通过差分化(differencing)…
学习建立GM(1,1)灰色预测评估模型,解决实际问题: SARS疫情对某些经济指标的影响问题 一.问题的提出 2003 年的 SARS 疫情对中国部分行业的经济发展产生了一定影响,特别是对部分 疫情较严重的省市的相关行业所造成的影响是显著的,经济影响主要分为直接经济影响 和间接影响.直接经济影响涉及商品零售业.旅游业.综合服务等行业.很多方面难以 进行定量的评估,现仅就 SARS 疫情较重的某市商品零售业.旅游业和综合服务业的影 响进行定量的评估分析. 究竟 SARS 疫情对商品零售业.旅游业和…
https://blog.csdn.net/varyall/article/details/81173326 如今在银行.消费金融公司等各种贷款业务机构,普遍使用信用评分,对客户实行打分制,以期对客户有一个优质与否的评判.但是不是所有人都知道信用评分卡还分A,B,C卡三类! A卡(Application score card)申请评分卡 B卡(Behavior score card)行为评分卡 C卡(Collection score card)催收评分卡 评分机制的区别在于: 1.使用的时间不同…