R语言︱LDA主题模型——最优主题...:https://blog.csdn.net/sinat_26917383/article/details/51547298#comments…
每每以为攀得众山小,可.每每又切实来到起点,大牛们,缓缓脚步来俺笔记葩分享一下吧,please~ --------------------------- 笔者寄语:在自己学LDA主题模型时候,发现该模型有这么几个未解决的问题: 1.LDA主题数量,多少个才是最优的. 2.作出主题之后,主题-主题,主题与词语之间关联如何衡量. 于是在查阅几位老师做的成果之后,将他们的成果撮合在一起.笔者发现R里面目前有两个包可以做LDA模型,是lda包+topicmodels包,两个包在使用的过程中,需要整理的数…
A IMA模型是一种著名的时间序列预测方法,主要是指将非平稳时间序列转化为平稳时间序列,然后将因变量仅对它的滞后值以及随机误差项的现值和滞后值进行回归所建立的模型.ARIMA模型根据原序列是否平稳以及回归中所含部分的不同,包括移动平均过程(MA).自回归过程(AR).自回归移动平均过程(ARMA)以及ARIMA过程.其中ARIMA(p,d,q)称为差分自回归移动平均模型,AR是自回归, p为自回归项: MA为移动平均,q为移动平均项数,d为时间序列成为平稳时所做的差分次数. 通常的建立ARIMA…
http://blog.csdn.net/pipisorry/article/details/45665779 主题模型LDA的应用 拿到这些topic后继续后面的这些应用怎么做呢:除了推断出这些主题,LDA还可以推断每篇文章在主题上的分布.例如,X文章大概有60%在讨论“空间探索”,30%关于“电脑”,10%关于其他主题. 这些主题分布可以有多种用途:聚类: 主题是聚类中心,文章和多个类簇(主题)关联.聚类对整理和总结文章集合很有帮助.参看Blei教授和Lafferty教授对于Science杂…
新入职的员工,有的没有相应银行卡,需要计算现金工资的币数.实发工资,一般取整数. 简化计算,纸币面值只有100.10.1.4278除以100等于42余78,78除以10等于7余8,8除以1等于8. 复杂计算,纸币面值有100.50.20.10.5.1.4278除以100等于42余78,78除以50等于1余28,28除以20等于1余8,8除以10等于0余8,8除以5等于1余3,3除以1等于3. R语言中,向下取整为%/%,取余为%%. 思路一取整配合取余. 思路二取整配合减法.4278%/%100…
R通过RODBC连接数据库 stats包中的st函数建立时间序列 funitRoot包中的unitrootTest函数检验单位根 forecast包中的函数进行预测 差分用timeSeries包中diff stats包中的acf和pacf处理自相关和偏自相关stats包中的arima函数模型…
rm(list=ls()) gc() memory.limit(4000) library(corrplot) library(rpart) data_health<-read.csv("D:/smart_data0608/smart_data_section_good_15.txt",header=FALSE,sep="\t",na.strings="None")#读健康数据 data_fault<-read.csv("D…
请见Github博客:http://wuxichen.github.io/Myblog/timeseries/2014/09/02/RJavaonLinux.html…
数据还有很多没弄好,程序还没弄完全好. > read.xlsx("H:/ProjectPaper/论文/1.xlsx","Sheet1") > item<- read.xlsx("H:/ProjectPaper/论文/1.xlsx","Sheet1") > item<- ts(item,start=c(2014)) > plot.ts(item) > itemdiff<- dif…
sumfu<-function(a,b,n=){ if(a<b){ for(i in a:b){n=n+i} }else for(i in b:a){n=n+i} return <-cat(" n= ",n) } sumfu(scan(),scan())…