6 ways of mean-centering data in R 怎么scale我们的数据? 还是要看我们自己数据的特征. 如何找到我们数据的中心? Cluster analysis with K-means. How to get the cluster representatives? 开发工具时不要先写代码,把算法理顺了再写,就会顺利得多. 1. 随机或者自定义一个点(基因),找到另一个符合条件的点(距离以及overlap数达标): 2. 算出新的group的中心,找下一个符合条件的点…
目录 Importing data in R 学习笔记1 flat files:CSV txt文件 packages:readr read_csv() read_tsv read_delim() data.table() fread readxl excel_sheets() read_excel() gdata read.xls() getSheets() XLConnect loadWorkbook() readWorksheet() createSheet() writeWorksheet…
1) 熟悉CEL file 从 NCBI GEO (http://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE24460)下载GSE24460. 将得到一个 GSE24460_RAW.tar 文件,解压.产生CEL文件,包含各种信息. if("affy" %in% rownames(installed.packages()) == FALSE) {source("http://bioconductor.org/biocLite.…
小伙伴儿们有福啦,2015年4月10日,Hadley Wickham大牛(开发了著名的ggplots包和plyr包等)和RStudio小组又出新作啦,新作品readr包和readxl包分别用于R读取text数据和Excel电子表格数据.事实上,R已经有了一堆读取数据的函数,比如read.table家族以及其巨多的变形,那么为了牛牛们为什么还要开发这两个包呢?原因很简单,这两个包的读取速度比R内置数据读入函数更快!!!记住哦,是快很多哈!不信,我们下来试试就知道啦!哈哈!平时读取小数据的童鞋可能不…
目录 R 中清洗数据 常见三种查看数据的函数 Exploring raw data 使用dplyr包里面的glimpse函数查看数据结构 \(提取指定元素 ```{r} # Histogram of BMIs from 2008 hist(bmi\)Y2008) Scatter plot comparing BMIs from 1980 to those from 2008 Introduction to tidyr gather() spread() spreate() unite() 常见数…
Around September of 2016 I wrote two articles on using Python for accessing, visualizing, and evaluating trading strategies (see part 1 and part 2). These have been my most popular posts, up until I published my article on learning programming langua…
python信用评分卡(附代码,博主录制) https://study.163.com/course/introduction.htm?courseId=1005214003&utm_campaign=commission&utm_source=cp-400000000398149&utm_medium=share  banking case1 http://ucanalytics.com/blogs/data-visualization-case-study-banking/ A…
When working with big data with R (say, using Spark and sparklyr) we have found it very convenient to keep data handles in a neat list ordata_frame. Please read on for our handy hints on keeping your data handles neat. When using R to work over a big…
Reading Data There are a few principal functions reading data into R. read.table, read.csv, for reading tabular data readLines, for reading lines of a text file source, for reading in R code files (inverse of dump) dget, for reading in R code files (…
东莞市 东莞城市标志 东莞城市标志 1985年,广东省东莞县经国务院批准列为珠江三角洲经济开发区,同年9月撤消东莞县,建立(县级)东莞市,1988年1月升格为地级市.东莞市是全国五个不设市辖区的地级市之一,直属广东省.行政区划代码:441900,区号:0769 .截至2011年10月10日,东莞市辖32个镇(街道):其中包括4个街道(莞城街道.南城街道.东城街道.万江街道):28个镇(石碣镇.石龙镇.茶山镇.石排镇.企石镇.横沥镇.桥头镇.谢岗镇.东坑镇.常平镇.寮步镇.大朗镇.黄江镇.清溪镇.…
0.前言 虽然很早就知道R被微软收购,也很早知道R在统计分析处理方面很强大,开始一直没有行动过...直到 直到12月初在微软技术大会,看到我软的工程师演示R的使用,我就震惊了,然后最近在网上到处了解和爬一些R的资料,看着看着就入迷了,这就是个大宝库了,以前怎么没发现,看来还是太狭隘了.直到前几天我看到这个Awesome R文档,我就静不下来了,对比了目前自己的工作和以后的方向,非常适合我.所以毫不犹豫的把这个文档汉化了,所以大家一起享受吧. 说明:本文已经提交到github,地址:https:/…
[翻译]Awesome R资源大全中文版来了,全球最火的R工具包一网打尽,超过300+工具,还在等什么? 阅读目录 0.前言 1.集成开发环境 2.语法 3.数据操作 4.图形显示 5.HTML部件 6.复用组件研究 7.Web技术和服务 8.并行计算 9.高性能 10.语言API 11.数据库管理 12.机器学习 13.自然语言处理 14.贝叶斯 15.最优化 16.金融 17.生物信息学 18.网络分析 19.R 开发 20.日志 21.数据包 22.其他工具 23.其他编译器 24.R学习…
[怪毛匠子整理] 1.下载 wget http://mirror.bjtu.edu.cn/cran/src/base/R-3/R-3.0.1.tar.gz 2.解压: tar -zxvf R-3.0.1.tar.gz cd R-3.0.1 3.安装 yum install readline-devel yum install libXt-devel ./configure 如果使用rJava需要加上 --enable-R-shlib ./configure  --enable-R-shlib -…
这里有很多非常不错的R包和工具. 该想法来自于awesome-machine-learning. 这里是包的导航清单,看起来更方便 >>>导航清单 通过这些翻译了解这些工具包,以后干活也就方便多了.不过翻译这个东西的确要靠耐心,翻译,编辑花费了至少一周的空余时间. 在编辑本文的过程中,惊喜的发现Awesome系列的其他资源:地址在github: 1.DotNet 资源大全中文版 2.Java资源大全中文版 3.JavaScript 资源大全中文版 一  集成开发环境 RStudio –…
Bioconductor简介 2012-10-09 ~ ADMIN 源:Bioconductor: open software development for computational biology and bioinformatics,Genome Biology 2004, 5:R80 Bioconductor的产生是计算生物学及生物信息学(computational biology and bioinformatics, CBB)发展的产物,其目的是有效降低CBB的门槛.当前,随着计算…
直到12月初在微软技术大会,看到我软的工程师演示R的使用,我就震惊了,然后最近在网上到处了解和爬一些R的资料,看着看着就入迷了,这就是个大宝库了,以前怎么没发现,看来还是太狭隘了.直到前几天我看到这个Awesome R文档,我就静不下来了,对比了目前自己的工作和以后的方向,非常适合我.所以毫不犹豫的把这个文档汉化了,所以大家一起享受吧. 这里有很多非常不错的R包和工具. 该想法来自于awesome-machine-learning. 这里是包的导航清单,看起来更方便 >>>导航清单 通过…
R in Nutshell 前言 例子(nutshell包) 本书中的例子包括在nutshell的R包中,使用数据,需加载nutshell包 install.packages("nutshell") 第一部分:基础 第一章 批处理(Batch Mode) R provides a way to run a large set of commands in sequence and save the results to a file. 以batch mode运行R的一种方式是:使用系统…
http://www.molecularevolution.org/resources/activities/QC_of_NGS_data_activity_new table of contents expected learning outcomes getting started exercise 1: checking Illumina data with the FASTX-Toolkit exercise 2: checking 454 data with the FASTX-Too…
现在对R感兴趣的人越来越多,很多人都想快速的掌握R语言,然而,由于目前大部分高校都没有开设R语言课程,这就导致很多人不知道如何着手学习R语言. 对于初学R语言的人,最常见的方式是:遇到不会的地方,就跑到论坛上吼一嗓子,然后欣然or悲伤的离去,一直到遇到下一个问题再回来.当然,这不是最好的学习方式,最好的方式是——看书.目前,市面上介绍R语言的书籍很多,中文英文都有.那么,众多书籍中,一个生手应该从哪一本着手呢?入门之后如何才能把自己练就成某个方面的高手呢?相信这是很多人心中的疑问.有这种疑问的人…
Jay & I cover dashboards in Chapter 10 of Data-Driven Security (the book) but have barely mentioned them on the blog. That’s about to change with a new series on building dashboards using the all-new shinydashboard framework developed by RStudio. Whi…
对于初学R语言的人,最常见的方式是:遇到不会的地方,就跑到论坛上吼一嗓子,然后欣然or悲伤的离去,一直到遇到下一个问题再回来.当然,这不是最好的学习方式,最好的方式是——看书.目前,市面上介绍R语言的书籍很多,中文英文都有.那么,众多书籍中,一个生手应该从哪一本着手呢?入门之后如何才能把自己练就成某个方面的高手呢?相信这是很多人心中的疑问.有这种疑问的人有福了,因为笔者将根据自己的经历总结一下R语言书籍的学习路线图以使Ruser少走些弯路. 本文分为6个部分,分别介绍初级入门,高级入门,绘图与可…
R是一种专门用于数据分析和统计的脚本语言,广泛应用在每一个需要统计和数据分析的领域.PowerBI支持R脚本,只不过,PowerBI Desktop默认没有安装R.在使用R脚本之前,必须向PowerBI Desktop中安装R引擎.用户可以使用R脚本加载数据.对数据进行转换和处理.使用R脚本图形化显示数据,以发现数据中隐藏的insight.PowerBI可以直接调用R外部IDE,提供更好的编程体验. 一,安装R 在使用R之前,用户必须向本地主机中安装R引擎.安装的过程非常简单,只需要点击File…
本文分为6个部分,分别介绍初级入门,高级入门,绘图与可视化,计量经济学,时间序列分析,金融等. 1.初级入门 <An Introduction to R>,这是官方的入门小册子.其有中文版,由丁国徽翻译,译名为<R导论>.<R4Beginners>,这本小册子有中文版应该叫<R入门>.除此之外,还可以去读刘思喆的<153分钟学会R>. 这本书收集了R初学者提问频率最高的153个问题.为什么叫153分钟呢?因为最初作者写了153个问题,阅读一个问题…
数据结构模板 Chen 2016/12/22 前言 本篇博客的模板,全部是我纯手打的,如果有发现错误,请在下方留言指正:).欢迎大家参考. 有一些地方还不是很完善,等过一阵子用C++实现和部分重构下. C/C++ 常用字符串函数 #include <string.h> strcpy char * strcpy( char * dest, const char * src ); 功能:把 src 所指由NULL结束的字符串复制到 dest 所指的数组中. 说明:src 和 dest 所指内存区域…
For example, change mysql data directory from /var/lib/mysql to /var/data/mysql Step1: Copy the /var/lib/mysql to new name /var/lib/mysqlnew cp -prvf /var/lib/mysql /var/lib/mysqlnew sudo vi /etc/mysql/my.cnf  Looking for: datadir = /var/lib/mysql Ch…
很多时候,mysql的数据会非常大,数据默认放在/var/lib/mysql,由于/var所划分的空间不够大,所以我们需要将mysql数据存放路径修改一下,放到大分区里面,以便可以应付mysql数据增长. 1.设置新的存放路径 mkdir -p /data/mysql 2.复制原有数据 cp -R /var/lib/mysql/* /data/mysql 3.修改权限 chown -R mysql:mysql /data/mysql 4.修改配置文件 vim /etc/mysql/my.cnf…
关联规则code{white-space: pre;} pre:not([class]) { background-color: white; }if (window.hljs && document.readyState && document.readyState === "complete") { window.setTimeout(function() { hljs.initHighlighting(); }, 0);} .main-contai…
[pdf你真可爱] [题目分析] 上午考试想到用二分答案做,写残了... 设两个数列,a和b,a表示磁头,看作指针,b就是要扫描的那个序列. 假设一个答案mid,就是a中的数字走mid步能否到达b中的数字,如果b能全部被扫描,说明这个答案是可以继续向左二分,否则就向右 具体就分三种情况: 1.a[i]-b[j]>mid,这种情况下怎么走都不可能把b完全覆盖(因为a和b都是递增的,前面的只要大于了,后面没有机会变小于啊),直接false 2.a[i]>b[j],rest表示从a[i]扫到b[j]…
R语言是针对统计分析和数据科学的功能全面的开源语言,R的官方网址:http://www.r-project.org/  在Windows环境下安装R是很方便的 R语言的两种运行模式:交互模式和批处理模式:顾名思义交互模式是一条输入一条输出,而批处理模式则可让处理过程自动化 批处理模式演示: pdf("demo.pdf") #创建demo.pdf文件 hist(rnorm(1000)) #调用hist()画直方图,调用rnorm()生成随机数 dev.off() #将实际文件输出到磁盘上…