读取文件的代码r语言(r读取数据代码)
r语言怎么读取txt文件
1、r语言读取txt文件的方法:首先根据下图图片中的命令代码进行输入
2、然后这样就可以读取txt文件了,结果图如下:
3、R读取csv文件的方法:在读取csv文件时,分割符为“,”;可以根据下方的代码进行编辑。
read.csv(file, header = TRUE, sep = ",", quote = "\"",
? ? ? dec = ".", fill = TRUE, comment.char = "", ...)
4、如果想要读取Excel表格数据的话,可以使用下方的方法来实现。
xls2csv(xls, sheet=1, verbose=FALSE, blank.lines.skip=TRUE, ..., perl="perl")
xls2tab(xls, sheet=1, verbose=FALSE, blank.lines.skip=TRUE, ..., perl="perl")
xls2tsv(xls, sheet=1, verbose=FALSE, blank.lines.skip=TRUE, ..., perl="perl")
xls2sep(xls, sheet=1, verbose=FALSE, blank.lines.skip=TRUE, ...,
? ? ?method=c("csv","tsv","tab"), perl="perl")
R语言读写最灵活的文件——txt文件
原文链接
R语言可以读取很多文件,其中以txt文本文件最为灵活,为什么呢,txt文件可以以任意符号作为分隔符,比如“,”,“\t”,空格,甚至`“……¥¥%¥”`等任意自定义的分隔符号。
这里先把工作空间切换到D盘下面,默认的一般是C盘的文档,我们要有分层管理文件的概念,否则我们还是一个合格的程序员吗?
setwd('D:\\')
读取文本文件主要用read.table(filePath,header = ,sep=)
filePath就是文件路径,header表示文件是否有头部,我这个文件没有头部,值就为false,sep表示文件是以什么符号作为分隔符号。
头部是什么意思呢?
现在这里有4个文件,分别以空格,逗号,制表符,“/”作为分隔符,下面分别将其读取:
dat - read.table('1.txt',header = FALSE,sep = ' ')
dat2 - read.table('2.txt',header = FALSE,sep = ',')
dat3 - read.table('3.txt',header = FALSE,sep = '\t')
dat4 - read.table('4.txt',header = FALSE,sep = '/')
读取出来的数据都是一样的:
因为第二个文件是以逗号作为分隔符,所以也是可以用read.csv()读取的,read.csv()也是一个读取文件函数,后面会讲到。
把刚才读取的数据写入到一个新的文本文件里面,可以用write.table(),形式为:
write.table(dat,file = ,sep = ,row.names,col.names)
分别表示,
dat:被写的数据,
file:文件名(包含路径),
sep:分隔符,
row.names:是否有行名(比如第一行,第二行。。)就是行名,
col.names:是否有列名,同上,
当然了,一般行名与列名需要取有实际意义的名字,比如列名可以取(年龄、性别、成绩,这种表格相信大家应该都见过吧!)。
这里分别用" ","aaa","\t"作为分隔符,生成了3个文件。
write.table(dat,file = '5.txt',sep = ' ')
write.table(dat,file = '6.txt',sep = 'aaa')
write.table(dat,file = '7.txt',sep = '\t')
这样就保存了三个文件。当然了,你可以保存成任意你喜欢、需要的分隔符号。
原文链接: 原文链接
R语言批量读文件
杀杀
前两天一个同学问了一个批量读数据(文件)的问题
感觉现在分析测序数据的话,在R中一次性读取多个文件的功能还是挺需要用到的
决定总结一下下
总不能写n行read.csv…balabala…去读取,那太麻烦了
于是决定使用批量读数据
首先我们要获取这个文件夹里所有的文件名字以便读取
接下来我们需要构建读文件的路径
ps: 在做这种批量操作时还是有必要先花时间测试一个样本是否能够成功,然后再去做批量的循环,这样也能方便自己找bug
因此我们先试着读取一个文件
这里因为例子中的文件格式比较特殊,所以使用的读取函数是read.delim,如果是.csv或.txt等格式,也可以替换成read.csv, read.table等函数。
好了测试通过,接下来开始批量读文件
需要注意的是,合并文件的时候,需要注意你是要取所有文件中行名的交集还是并集,或者最后你是否有一个统一的行名来规整所有文件。(当然如果你确定每个文件的行名都是相同的,就可以直接cbind),我遇到过需要取交集的情况,可以写一个循环对每个文件的行名做交集,用最终的交集文件去match出所有你要的行然后合并。
但是这个例子中,有的文件的行名是1-4000,有的是5000-8000,存在非常大的差异,而需求是最后整合成一个行名为0-8000的矩阵,因此我先建立一个0-8000的列作为行名,把每个文件和这列进行一个match操作,然后未match到的填充为0。
其实没有很难的部分,主要是需要读取文件夹中的所有文件名,然后循环读取就行了。
R语言文件读取
参考文章地址()
逗号分隔文件 (.csv文件)、 制表符分隔文件 (.tsv文件)和 空格分隔文件 (.txt文件)
(一).csv文件的读取
mydata - read.csv(file=" ", header=T, sep=",", quote="\", dec=".", fill=T, comment.char=" ")
comment.char用于设置需要跳过的内容,比如需要跳过的行前面有“#”,那么设置comment.char=“#”,当然你也可以设置从中间开始读,注意,这个函数是read.csv里面的哦!
file: 以csv结尾的文件名,由文件所在路径及其文件名构成
header:是否把第一行作为表头
sep:分隔方式,csv文件分隔读入参数设置为"."
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?tsv文件分隔读入参数设置为"\t"
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?txt文件分隔为空格,不需要设置sep参数
也可以通过mydata - read.table("D:/mydata.csv", header=T, sep=",", row.names="id")读取
(二).tsv文件的读取
mydata - read.table("D:/mydata.tsv", header=T, sep="\t", row.names="id")
除了分隔方式跟上面一样
(三).txt文件的读取
mydata - read.table("c:/mydata.txt", header=TRUE, row.names="id")
除了分隔方式跟上面一样
(四)以.gz结尾的压缩文件的读取
1.在R中可以使用gzfile()的方式读取压缩文件
2.使用data.table包里的fread()函数
安装并加载data.table包
install.packages("data.table")
library(data.table)
使用fread()函数读取文件,这里参数和之前的一致,唯一的不同就是fread()可以直接读取压缩文件
mydata - fread(‘c:/mydata.txt.gz’, header=T, row.names=’id’)
(五)读取.xlsx后缀文件,也就是excel文件
1. 安装并加载openxlsx包
install.packages("openxlsx")
library(openxlsx)
2.进行数据的导入
mydata - read.xlsx( "mydata.xlsx",rowNames=T)
其他参数可以通过??read.xlsx在R中根据需要进行添加的。
R语言 读取大文件fread()
# R语言 读取大文件fread()
library(data.table)
visitor_sensor-fread('data_visitor_sensor.csv',header = TRUE)