本文首发于“生信补给站”微信公众号,https://mp.weixin.qq.com/s/8IfMrSr9xc8_1Y2_9Ne6hg 在一个文件夹下有很多字段一致,格式统一的数据文件(csv,txt,excel),可以使用R快速的统一成一个文件方便后续分析和处理. 数据准备 将需要处理的字段一致,格式统一的数据文件(csv,txt,excel),放到文件夹内,并将此文件夹设置为工作目录,下面分情况介绍如何批量读取并合并数据. 1)文件夹内只有一种格式的文件:csv,txt,excel: 2)文…
导出CSV格式文件,用Excel打开乱码的解决办法 1.治标不治本的办法 将导出CSV数据文件用记事本打开,然后另存为"ANSI"编码格式,再用Excel打开,乱码解决. 但是,这个办法对于软件开发来说,就是不具有友好性,治标不治本 2.利用兼容微软,指定BOM的办法 ServletOutputStream out = response.getOutputStream(); out.write(new byte[]{(byte)0xEF,(byte)0xBB,(byte)0xBF});…
最近接触一些需要csv,txt,excel文件之间的转换,根据一些网上搜索加上自己的改动,实现自己想要的结果为主要目的,代码的出处已经找不到了,还请见谅,以下主要是针对csv&excel 和txt&excel写的perl脚本. 主要用到的模块是:   Text::CSVSpreadsheet::WriteExcel Spreadsheet::ParseExcel Spreadsheet::ParseExcel::FmtUnicode Unicode::Map 可以支持中文,具体也没有要仔细…
最近在整理文件,准备把vcf文件转化为Excel格式,或者CSV格式,网上搜了一堆资料,还真有人专门开发出转化格式的工具:叫vcf2csv(下载地址http://vcf2csv.sourceforge.net/#links),赶紧下载安装,开始转化,结果弹出行列不一致的错误,遂放弃. 尝试了一堆无用的工具以后,想着能不能用R的write.csv来实现转化,结果顺利解决.现将示例代码演示一下: data<-read.table("/path/data.vcf",header=F)…
下面的代码演示如何将当前目录下sj目录下的所有.Z格式文件解压到sj_result目录下. 代码示例: for file in `ls ./sj` do prefix=${file%.*} echo $prefix zcat ./sj/$file > ./sj_result/$prefix done…
vennDiagram包中的主函数绘图时,好像不直接支持PDF格式文件: dat = list(a = group_out[[1]][,1],b = group_out[[2]][,1]) names(dat) <- group_names[1:2] venn.plot <- venn.diagram( dat, filename = "proteinGroup_venn.tiff", #pdf error imagetype = "tiff", #pd…
本代码演示: pandas读取纯文本文件 读取csv文件 读取txt文件 pandas读取xlsx格式excel文件 pandas读取mysql数据表 import pandas as pd 1.读取纯文本文件 1.1 读取CSV,使用默认的标题行.逗号分隔符 fpath = "./datas/ml-latest-small/ratings.csv" # 使用pd.read_csv读取数据 ratings = pd.read_csv(fpath) # 查看前几行数据 ratings.h…
一.1.通过csv文件批量导入数据 1 from selenium import webdriver from time import ctime,sleep import csv #循环读取每一行每一个字段csv bid_info = csv.DictReader(open('E:\\script\\python-script\\demo_test_courses.csv','r')) dict_data = [] for lines in bid_info: if bid_info.line…
导入CSV.TXT文件 read.table函数:read.table函数以数据框的格式读入数据,所以适合读取混合模式的数据,但是要求每列的数据数据类型相同. read.table读取数据非常方便,通常只需要文件路径.URL或连接对象就可以了,也接受非常丰富的参数设置: file参数:这是必须的,可以是相对路径或者绝对路径(注意:Windows下路径要用斜杠'/'或者双反斜杠'\\'). header参数:默认为FALSE即数据框的列名为V1,V2...,设置为TRUE时第一行作为列名. dat…
//随机生成文件 //文件名会带数字的...注意echo后面的是反引号,不是单引号 #!/bin/bash dir=/root/bp for i in 'seq 10' touch $dir`echo $RANDOM|md5sum|cut -c 1-10`.html done //在上面的基础上批量删改文件 #!/bin/bash dir=/root/bp for i in 'ls' a=`echo $i|cut -c 1-10` //找到前面的名字,忽略后面固定的部分 mv ${a}_oldb…