python读取data数据(python读取data文件)
pythondata.txt文件中的个数据提出来赋值用什么代码
1. 使用open函数 这个方法是Python中最基本的读取文件数据的方法,读取任何的文件都可以使用这个函数,它会将会文件中的数据读取到一个列表中,然后在使用这个函数
2. 使用numpy包的loadtxt方法 这种方法通常会在对实验的数据进行处理的时候才使用到,numpy它本身是一个计算包,所以在使用loadtxt方法是时候,文件中的数据
python怎么从excel中读取数据?
#导入包
import xlrd
#设置路径
path='C:\\Users\\jyjh\\Desktop\\datap.xlsx'
#打开文件
data=xlrd.open_workbook(path)
#查询工作表
sheets=data.sheets()
sheets
可以通过函数、索引、名称获得工作表。
sheet_1_by_function=data.sheets()[0]
sheet_1_by_index=data.sheet_by_index(0)
sheet_1_by_name=data.sheet_by_name(u'Sheet1')
可以通过方法获得某一列或者某一行的数值。
sheet_1_by_name.row_values(1)
sheet_1_by_name.col_values(1)
通过工作表的属性获得行数和列数。
n_of_rows=sheet_1_by_name.nrows
n_of_cols=sheet_1_by_name.ncols
也可以用一个循环来遍历一次文件。
for i in range(n_of_rows):
print sheet_1_by_name.row_values(i)
可以通过以下的任意一种方式访问单元格的数值。
cell_A1=sheet_1_by_name.cell(0,0).value
cell_A1=sheet_1_by_name.row(0)[0].value
cell_A1=sheet_1_by_name.col(0)[0].value
最后通过以下的方法对单元格的数值进行修改。
row=0
col=0
#ctype 0:empty,1:string,2:number,3:date,4:boolean,5:error
cell_type=1
value='Hello,Excel'
cell_A1=sheet_1_by_name.cell(0,0).value
format=0
sheet_1_by_name.put_cell(row,col,cell_type,value,format)
cell_A1=sheet_1_by_name.cell(0,0).value
Python[1]? (英国发音:/?pa?θ?n/ 美国发音:/?pa?θɑ?n/), 是一种面向对象的解释型计算机程序设计语言,由荷兰人Guido van Rossum于1989年发明,第一个公开发行版发行于1991年。
Python是纯粹的自由软件, 源代码和解释器CPython遵循 GPL(GNU General Public License)协议。Python语法简洁清晰,特色之一是强制用空白符(white space)作为语句缩进。
Python具有丰富和强大的库。它常被昵称为胶水语言,能够把用其他语言制作的各种模块(尤其是C/C++)很轻松地联结在一起。常见的一种应用情形是,使用Python快速生成程序的原型(有时甚至是程序的最终界面),然后对其中有特别要求的部分,用更合适的语言改写,比如3D游戏中的图形渲染模块,性能要求特别高,就可以用C/C++重写,而后封装为Python可以调用的扩展类库。需要注意的是在您使用扩展类库时可能需要考虑平台问题,某些可能不提供跨平台的实现。
7月20日,IEEE发布2017年编程语言排行榜:Python高居首位。
python写入和读取h5、pkl、mat 文件
python中使用h5py对HDF5文件进行操作。
1、创建文件和数据集
import h5py
import numpy as np
imgData = np.zeros((2,4))
f = h5py.File('HDF5_FILE.h5','w') #创建一个h5文件,文件指针是f
f['data'] = imgData #将数据写入文件的主键data下面
f['labels'] = np.array([1,2,3,4,5]) #将数据写入文件的主键labels下面
f.close() #关闭文件
f = h5py.File('HDF5_FILE.h5','r') #打开h5文件
for key in f.keys():
print(f[key].name)
print(f[key].shape)
print(f[key].value)
输出结果:
/data
(2, 4)
[[ 0. 0. 0. 0.]
[ 0. 0. 0. 0.]]
/labels
(5,)
[1 2 3 4 5]
Process finished with exit code 0
写入读取pkl文件
1)字典类型:
import pickle
dict_data={'name':["张三","李四"]}
with open("dict_data.pkl","wb") as fo:
pickle.dump(dict_data,fo)
with open("dict_data","rb") as fo:
dict_data=pickle.load(fo,encoding='bytes')
print(dict_data.keys())
print(dict_data)
print(dict_data["name"])
结果如下:
dict_keys(['name'])
{'name': ['张三', '李四']}
['张三', '李四']
2)列表类型
import pickle
list_data=["张三","李四"]
with open ("list_data","wb") as fo:
pickle.dump(list_data,fo)
with open("list_data","rb") as fo:
pickle.load(fo,encoding='bytes')
print(list_data)
print(list_data.keys())
pirnt(list_data["name"])
mat文件
mat数据格式是Matlab的数据存储的标准格式。在Matlab中主要使用load()函数导入一个mat文件,使用save()函数保存一个mat文件。对于文件data.mat:
load(‘data.mat')
save('data_1.mat','A')
其中'A’表示要保存的内容。
在python读取mat文件:
1、读取文件:
import scipy.io as scio
file1='E://data.mat'
data=scio.loadmat(file1)
注意,读取出来的data是字典格式,可以通过函数type(data)查看。
print type(data)
结果显示
type 'dict'
找到mat文件中的矩阵:
print data['A']
结果显示
python读取numbers数据并输出
import pandas as pd # 导入pandas包,用于读取文件
data = pd.read_excel('XXX.xlsx') # 读取文件名为XXX的文件
# data = pd.read_excel(r'XXX.xlsx') # 这行代码上行效果相同,r代表read读取文件,默认是r
data.head() # 查看数据
# data.head(6) # 查看前6行数据
登录后复制
data.to_excel('XXX.xlsx', index=False) # 将data数据集导出至名为XXX的文件中。
python读取文件—txt文件常用读写操作
f = open("data.txt","r")? ?#设置文件对象
f.close() #关闭文件
为了方便,避免忘记close掉这个文件对象,可以用下面这种方式替代
with open('data.txt',"r") as f:? ? #设置文件对象
?str = f.read()()? ? #可以是随便对文件的操作
f = open("data.txt","r")? ?#设置文件对象
str = f.read()? ???#将txt文件的所有内容读入到字符串str中
f.close()? ?#将文件关闭
f = open("data.txt","r")? ?#设置文件对象
line = f.readline()
line = line[:-1]
while line:? ?? ?? ?? ? #直到读取完文件
? ? ?line = f.readline()??#读取一行文件,包括换行符
? ? ?line = line[:-1]? ???#去掉换行符,也可以不去
f.close() #关闭文件
data = []
for line in open("data.txt","r"): #设置文件对象并读取每一行文件
? ? ?data.append(line)? ?? ?? ?? ?? ?#将每一行文件加入到list中
?f = open("data.txt","r")? ?#设置文件对象
?data = f.readlines()??#直接将文件中按行读到list里,效果与方法2一样
?f.close()? ?? ?? ?? ? #关闭文件
可以使用pandas的.read_csv,读取文件的时候可以给每一列起名字,通过列名来调取相应列的数据。
import pandas as pd
data = pd.read_csv(" OSDO1012.txt",sep=',',header=None, names=['lat','lon','time','z']
使用data.lat就可以读取名为lat这一列的数据
?data = np.loadtxt("data.txt",skiprows = 1)? ?#将文件中数据加载到data数组里,并且跳过第一行
?with open('data.txt','w') as f:? ? #设置文件对象
? ? f.write(str)? ?? ?? ?? ?? ???#将字符串写入文件中
data = ['a','b','c']
单层列表写入文件
with open("data.txt","w") as f:
? ? f.writelines(data)
每一项用空格隔开,一个列表是一行写入文件
data =[ ['a','b','c'],['a','b','c'],['a','b','c']]
with open("data.txt","w") as f:? ? ? ? ? ? ? ? ? ? ? #设置文件对象
? ? ?for i in data:? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? #对于双层列表中的数据
? ? ? i = str(i).strip('[').strip(']').replace(',','').replace('\'','')+'\n'??#将其中每一个列表规范化成字符串
? ? ?f.write(i)? ? ? ? ? ? ? ? ? ? ? #写入文件
直接将每一项都写入文件
data =[ ['a','b','c'],['a','b','c'],['a','b','c']]
with open("data.txt","w") as f:? ? ? ? ? ? ? ? ? ? #设置文件对象
? ? ?for i in data:? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? #对于双层列表中的数据
? ? ? ? ? f.writelines(i)? ? ? ? ? ? ? ? ? ? ? ? ? ? #写入文件
np.savetxt("data.txt",data)? ???#将数组中数据写入到data.txt文件
np.save("data.txt",data)? ?? ???#将数组中数据写入到data.txt文件
python读取财经数据
提取日期数据基本语法
from WindPy import w
w.start()
当出现.ErrorCode==-103说明没连接上,要start一下
w.wsd(security, fields, startDate = None, endDate= None , options = None)
opion 可选(period, 日期类型, 货币类型,前后复权)
提取财务数据基本语法
w.wss(security, fields, options = None)
提取板块日序列基本语法
w.wses(sectorCode, fields, startDate = None, endDate = None, options = None)
提取板块日截面数据基本语法
w.wsee(sectorCode, fields, options=None)
提取宏观数据基本语法
w.edb(codes, startDate =None, endDate =None, options=None)
1.日期序列基本语法
ts.get_hist_data(stock,start,end)
注意:1.stock不能是集合,只能单个股票 2.需要带上.sz或.sh 3.没有field,只能取出数据后再切除.
2.pro用法
pro.daily(code, start, end, fields)
tushare引用语句
弊端也很明显,一方面不能stock集合输入,一次只能调取一个股票对应数据,另一方面tushare虽是免费试用,但有权限限制。
基本语法
wb.get_data_yahoo(code, start, end)
wb.DataReader(code, 'yahoo', start, end)
没法添加fields, 虽能集合适用,但出来的索引挺奇怪的
推荐使用定义函数或用for循环批量获取数据
总体感觉wind api最舒服,但需要账号,mac也不能直接调用wind api。还是推荐tushare的pro用法。
小白学习中,请指教=v=