python怎么导入数据文件(python中怎么导入数据)
python如何导入数据
通过标准的Python库导入CSV文件:
Python提供了一个标准的类库CSV文件。这个类库中的reader()函数用来导入CSV文件。当CSV文件被读入后,可以利用这些数据生成一个NumPy数组,用来训练算法模型:
新手学习Python,求教Python中如何导入excel数据
读excel要用到xlrd模块,官网安装()。然后就可以跟着里面的例子稍微试一下就知道怎么用了。大概的流程是这样的:
1、导入模块
import xlrd
2、打开Excel文件读取数据
data = xlrd.open_workbook('excel.xls')
3、获取一个工作表
① table = data.sheets()[0] #通过索引顺序获取
② table = data.sheet_by_index(0) #通过索引顺序获取
③ table = data.sheet_by_name(u'Sheet1')#通过名称获取
4、获取整行和整列的值(返回数组)
table.row_values(i)
table.col_values(i)
5、获取行数和列数
table.nrows
table.ncols
6、获取单元格
table.cell(0,0).value
table.cell(2,3).value
就我自己使用的时候觉得还是获取cell最有用,这就相当于是给了你一个二维数组,余下你就可以想怎么干就怎么干了。得益于这个十分好用的库代码很是简洁。但是还是有若干坑的存在导致话了一定时间探索。现在列出来供后人参考吧:
1、首先就是我的统计是根据姓名统计各个表中的信息的,但是调试发现不同的表中各个名字貌似不能够匹配,开始怀疑过编码问题,不过后来发现是因为空格。因为在excel中输入的时候很可能会顺手在一些名字后面加上几个空格或是tab键,这样看起来没什么差别,但是程序处理的时候这就是两个完全不同的串了。我的解决方法是给每个获取的字符串都加上strip()处理一下。效果良好
2、还是字符串的匹配,在判断某个单元格中的字符串(中文)是否等于我所给出的的时候发现无法匹配,并且各种unicode也不太奏效,百度过一些解决方案,但是都比较复杂或是没用。最后我采用了一个比较变通的方式:直接从excel中获取我想要的值再进行比较,效果是不错就是通用行不太好,个呢不能问题还没解决。
二、写excel表
写excel表要用到xlwt模块,官网下载()。大致使用流程如下:
1、导入模块
复制代码代码如下:
import xlwt
2、创建workbook(其实就是excel,后来保存一下就行)
复制代码代码如下:
workbook = xlwt.Workbook(encoding = 'ascii')
3、创建表
复制代码代码如下:
worksheet = workbook.add_sheet('My Worksheet')
4、往单元格内写入内容
复制代码代码如下:
worksheet.write(0, 0, label = 'Row 0, Column 0 Value')
5、保存
复制代码代码如下:
workbook.save('Excel_Workbook.xls')
python将txt导入到excel
你说的是使用python读取dat,txt类型文件或excel文件吧,这里我不清楚dat类型文件是什么类型的文件,数据格式是怎样的,所以主要讲一下如何简单快捷的读取txt文件指定的列数据和excel文件指定的列数据,主要用到numpy,pandas这两个包,这两个主要做科学计算和数据处理,python处理实验数据,经常要用到这两个包,至于dat类型的文件,我提供一种可能的思路,实验环境win7+python3.6+pycharm,主要步骤如下:
1.读取txt文件指定列。这里主要用到numpy这个包,以及其包含的loadtxt函数,读取的前提是txt文件不是完全的杂乱无章,没有一点格式、结构可循,如果真的是这样,建议手动调整一下格式,使其尽量保持一定的格式结果,然后再读取,不然的话,会出现错误,我这里新建了一个txt文件,样本内容如下,每行的数据以3个空格为间隔,一般情况下,实验所产生的txt数据都是有一定结构的:
对应读取的代码如下,这里以读取1,3列数据为例,很简单:
程序运行结果如下,已经成功打印出1,3列数据:
2.读取excel文件指定的列。这里主要用到pandas这个包,以及其包含的read_excel函数,因为excel数据本来就是有一定格式的,所以读起来就简单了许多,这里我新建了一个excel文件,样本数据如下:
对应读取的代码如下,这里以读取1,3列数据为例,很简单:
程序运行结果如下,已经成功打印出1,3列数据:
3.至于dat文件的话,这里提供一种可能思路,如果dat文件可以直接用记事打开的话,并且数据可以正常显示,没有乱码的情况下,有一定的格式可循,可以将其看作一个普通文件,使用python的open函数进行读取,将读取的数据存储在一个list列表中,或者使用特定软件将其转换成txt或excel文件后,再进行读取。如果是特殊类型的文件,这个就不好说了,这里就要自己想办法了。
至于后面如何进行可视化绘图,我就不多说了,像matplotlib等数据可视化包都可以。至此,就完成了这3中类型文件的读取,总的来说,实现起来不难,都有现成的包可直接利用,方便了许多,当然你也可以用其他包或者自己来实现,这个就因人而异了,只要能正常的读取实验数据就行,网上也有这方面的资料,你可以参考一下,希望以上分享的内容能对你有所帮助吧。
python如何导入excel文件数据
python处理数据文件第一步是要读取数据,文件类型主要包括文本文件(csv、txt等)、excel文件、数据库文件、api等.下面整理下python有哪些方式可以读取数据文件.1. python内置方法(read、readline、readline
python导入数据到origin
python导入数据到origin?
文章为自己学习过程中的记录,仅做参考,如有不同,以你为准。
1.导入excel数据,不支持.xls文件,注意后缀,直接改为.xlsx即可。不影响。
2.OriginPro将工作簿画图的步骤。导入数据后为工作表格式-转化为矩阵,如图所示依次选择:工作表-转化为矩阵-直接转换或根据自己要求选择。
然后就会生成矩阵,点击矩阵外框-选择绘图,即可根据自己的要求选择简单的绘图。
1 如何用Python导入Excel以及csv数据集
Excel是一个二进制文件,它保存有关工作簿中所有工作表的信息
CSV代表Comma Separated Values 。这是一个纯文本格式,用逗号分隔一系列值
Excel不仅可以存储数据,还可以对数据进行操作
CSV文件只是一个文本文件,它存储数据,但不包含格式,公式,宏等。它也被称为平面文件
Excel是一个电子表格,将文件保存为自己的专有格式,即xls或xlsx
CSV是将表格信息保存为扩展名为.csv的分隔文本文件的格式
保存在excel中的文件不能被文本编辑器打开或编辑
CSV文件可以通过文本编辑器(如记事本)打开或编辑
excel中会有若干个表单,每个表单都会这些属性:?
行数(nrows) 列数(ncols) 名称(name) 索引(number)?
import xlrd //执行操作前需要导入xlrd库?
#读取文件?
excel = xlrd.open_workexcel("文件地址") //这里表格名称为excel,文件的地址可以从文件的属性中看到?
#读取表格表单数量?
sheet_num= excel.nsheets // sheet_num为变量,其值为表格表单数量?
#读取表格表单名称?
sheet_name = excel.sheet_names() // sheet_name为变量,其值为表格表单名称?
#如果想要看到上述两个变量,可以使用print()函数将它们打印出来?
#想要读取某个表单的数据,首先获取表单 excel.sheet_by_index(0)?
//表单索引从0开始,获取第一个表单对象 excel.sheet_by_name('xxx')?
// 获取名为”xxx”的表单对象 excel.sheets()?
// 获取所有的表单对象 获取单元格的内容:使用cell_value 方法 这里有两个参数:行号和列号,用来读取指定的单元格内容。?
第一行的内容是:sheet.row_values(rowx=0)?
第一列的内容是:sheet.col_values(colx=0)
CSV是英文Comma Separate Values(逗号分隔值)的缩写,文档的内容是由 “,” 分隔的一列列的数据构成的。在python数据处理中也经常用到。
import csv //执行操作前需要导入csv库?
#csv读取?
遍历其中数据 csv_file = csv.reader(open(‘文件地址’,’r’)) for x in csv_file print(x)