python读取文件数据集有多少元组和字段(python如何对读取的文件
python读取TXT内容后怎么计算里面数据?
读取的类型为str类型,使用int(txt)函数将其转化为数字,有小数的用float,txt里不能有除数字外的其他字符或者符号,你这种有,的,使用分隔函数split,怎么使用可以百度,分隔之后的为列表或者元组,有几个,就分成几个。
Python如何从文件读取数据
1.1 读取整个文件
要读取文件,需要一个包含几行文本的文件(文件PI_DESC.txt与file_reader.py在同一目录下)
PI_DESC.txt
3.1415926535
8979323846
2643383279
5028841971
file_reader.py
with open("PI_DESC.txt") as file_object:
contents = file_object.read()
print(contents)
我们可以看出,读取文件时,并没有使用colse()方法,那么未妥善的关闭文件,会不会导致文件收到损坏呢?在这里是不会的,因为我们在open()方法前边引入了关键字with,该关键字的作用是:在不需要访问文件后将其关闭
1.2文件路径
程序在读取文本文件的时候,如果不给定路径,那么它会先在当前目录下进行检索,有时候我们需要读取其他文件夹中的路径,例如:
现在文件PI_DESC.txt存储在python目录的子文件夹txt中
那么我们读取文本内容的代码得修改为:
with open("txt\PI_DESC.txt") as file_object:
contents = file_object.read()
print(contents)
给open参数传递的参数得给相对路径
在Windows中,使用反斜杠(\),但是由于python中,反斜杠被视为转义字符,在Windows最好在路径开头的单(双)引号前加上r
相对路径:即相对于程序文件的路径
绝对路径:即文本在硬盘上存储的路径
使用绝对路径的程序怎么写呢 ?
with open(r"D:\python\txt\PI_DESC.txt") as file_object:
contents = file_object.read()
print(contents)
1.3逐行读取
读取文件时,可能需要读取文件中的每一行,要以每一行的方式来检查文件或者修改文件,那么可以对文件对象使用for循环
file_path = 'txt\PI_DESC.txt'with open(file_path) as file_object:
for line in file_object:
print(line)
程序运行结果如下:
通过运行结果我们可以看出,打印结果中间有很多空白行,这些空白行是怎么来的呢?因为在这个文件中,每行的末尾都有一个看不见的换行符,而print语句也会加一个换行符,因此每行末尾就有2个换行符:一个来自文件,另外一个来自print,消除这些换行符,只需要使用方法rstrip()
file_path = 'txt\PI_DESC.txt'with open(file_path) as file_object:
for line in file_object:
print(line.rstrip())
打印结果
通过运行结果我们可以看出,打印结果中间有很多空白行,这些空白行是怎么来的呢?因为在这个文件中,每行的末尾都有一个看不见的换行符,而print语句也会加一个换行符,因此每行末尾就有2个换行符:一个来自文件,另外一个来自print,消除这些换行符,只需要使用方法rstrip()
file_path = 'txt\PI_DESC.txt'with open(file_path) as file_object:
for line in file_object:
print(line.rstrip())
打印结果
1.4创建一个包含文件各行内容的列表
使用关键字with时,open()返回的文件对象只能在with代码块可用,如果要在with代码块外访问文件的内容,可在with块中将文件各行存储在一个列表,并在with代码块外使用该列表
file_path = 'txt\PI_DESC.txt'with open(file_path) as file_object:
lines = file_object.readlines()for line in lines:
print(line.rstrip())
1.5使用文件的内容
在上面一节中我们提到把数据提取到内存中,那么我们就可以对数据进行随心所欲的操作了
需要:将圆周率连在一起打印出来(删除空格),并打印其长度
file_path = 'txt\PI_DESC.txt'with open(file_path) as file_object:
lines = file_object.readlines()pi_str = ''for line in lines:
pi_str += line.strip()print(pi_str.rstrip())print(len(pi_str.rstrip()))
file_path = 'txt\PI_DESC.txt'with open(file_path) as file_object:
lines = file_object.readlines()pi_str = ''for line in lines:
pi_str += line.strip()print(pi_str.rstrip())print(len(pi_str.rstrip()))
注意最后print语句并没有缩进,如果是缩进的话就会每取一行打印一次
打印效果如下
python数据集
python数据集
===
列表
创建列表
a = [23, 45, 1, -3434, 43624356, 234]
查询列表
切片
增加
修改
删除
循环
排序
===
元组
元组是由数个逗号分割的值组成
a = 'Fedora', 'catkin', 'Kubuntu', 'Pardus'
===字符串
字符串是一个有序的字符集合,用于存储和表示基本的文本信息,用单引号,或双引号,或三引号括起来
===字典
字典是一种key---value的数据类型,使用就像我们使用字典,通过拼音或笔画查找字的详细类容
字典是是无序的键值对(key:value)集合,同一个字典内的键必须是互不相同的。一对大括号 {} 创建一个空字典。初始化字典时,在大括号内放置一组逗号分隔的键:值对,这也是字典输出的方式。我们使用键来检索存储在字典中的数据。
data = {'kushal':'Fedora', 'kart_':'Debian', 'Jace':'Mac'}
===集合
集合是一个无序的,不重复的数据组合,
集合是一个无序不重复元素的集。基本功能包括关系测试和消除重复元素。集合对象还支持 union(联合),intersection(交),difference(差)和 symmetric difference(对称差集)等数学运算。
作用:
去重,把一个列表当成集合,就自动去重了
关系测试,测试两组数据之间的交集,差集,并集等关系
Python知识-九大数据类型
①整数类型
简称整型,与数学中整数的概念一致。整型数据的表示方式有4种,分别是十进制、二进制(以0B或0b开头)、八进制(以0o或0O开头)和十六进制(以0X或0x开头)。
使用Python的内置函数type()可以测试各种数据类型。
②浮点型
用于表示数学中的实数,是带有小数的数据类型。例如:3.14、1.0都是浮点型。
浮点型可以用十进制或科学记数法表示。
③字符串类型
Python的字符串,是用单引号、双引号和三引号括起来的字符序列。
例如: "python"
④列表类型
列表是一种数据集合,列表用中括号[]来表示,列表内容以逗号进行分隔。
例如:[1,2,3]
⑤元组类型
元组是由0个或多个元素组成的不可变序列类型。元组用小括号()来表示。
例如:(1,2,3)
元组与列表的区别在于:元组的元素不能修改
⑥字典类型
字典是Python中唯一内置的映射类型,可用来实现通过数据查找关联数据的功能。
字典包括两个部分:键和值,用花括号{}表示,元素之间用逗号分隔,键和值之间用冒号分隔。
例如:{"name":"sun","age":12}
⑦集合类型
集合由各种类型的元素组成,但元素之间没有任何顺序,并且元素都不重复。
例如:set([1,2,3])
⑧复数类型
用于表示数学中的复数。例如:1 5j
⑨布尔类型
布尔型数据只有两个取值:True 和 False.
如果将布尔值进行数值运算,True会被当做整型1,False会被当做整型0。
python的数据类型有哪些?
第一种:整数
python可以处理任意大小的整数,当然包含负整数,在python程序中,整数的表示方法和数学上的写法一模一样,比如:1,100,-8080,0,等。
计算机由于使用二进制,所以有时候用十六进制表示整数比较方便,十六进制用0x前缀和0-9,a-f表示,比如:0xff00。
第二种:浮点数
浮点数也就是小数,之所以称为浮点数,是因为按照科学计数法表示时,一个浮点数的小数点位置是可变的。浮点数可以用数学写法,比如1.23,3.15,-9.01等。但是对于很大或者很小的浮点数,就必须用科学计数法表示,把10用e替代,1.23x10^9就是1.23e9。
整数和浮点数在计算机内部存储的方法是不同的,整数运算永远是精确的,而浮点数运算则可能会有四舍五入的误差。
第三种:字符串
字符串是以“或”括起来的任意文本,比如'abc','xyz'等。请注意,“或”本身只是一种表示方式,不是字符串的一部分,因此,字符串'abc'只有a,b,c这3个字符。
第四个:布尔值
布尔值和布尔代数的表示完全一致,一个布尔值只有True、False两种值,要么是True,要么是False,在python中,可以直接用True、False表示布尔值,也可以通过布尔运算计算出来。
布尔值可以用and、or或not运算。
and运算是与运算,只有所有都为True,and运算结果才是True。
or运算是或运算,只要其中有一个为True,or运算结果就是True。
not运算是非运算,它是一个单目运算符,把True变成False,False变成True。
第五个:空值
空值是python里一个特殊的值,用None表示。None不能理解为0,因为0是有意义的,而None是一个特殊的空值。
此外,python还提供了列表、字典等多种数据类型,还允许创建自定义数据类型。
python数据类型有哪些
数据类型是每种编程语言必备的属性,只有给数据赋予明确的数据类型,计算机才能对数据进行处理运算,因此,使用正确的数据类型是十分有必要的,以下是Python编程常用的数据类型:
一、数字型
Python数字类型主要包括int(整型)、long(长整型)和float(浮点型),但是在Python3中就不再有long类型了。
1、int(整型)
在32位机器上,整数的位数是32位,取值范围是-231~231-1,即-2147483648~214748364;在64位系统上,整数的位数为64位,取值范围为-263~263-1,即9223372036854775808~9223372036854775807。
2、long(长整型)
Python长整型没有指定位宽,但是由于机器内存有限,使用长的长整数数值也不可能无限大。
3、float(浮点型)
浮点型也就是带有小数点的数,其精度和机器有关。
4、complex(复数)
Python还支持复数,复数由实数部分和虚数部分构成,可以用 a + bj,或者 complex(a,b) 表示, 复数的实部 a 和虚部 b
都是浮点型。
二、字符串
在Python中,加了引号的字符都被认为是字符串,其声明有三种方式,分别是:单引号、双引号和三引号;Python中的字符串有两种数据类型,分别是str类型和unicode类型,str类型采用的ASCII编码,无法表示中文,unicode类型采用unicode编码,能够表示任意字符,包括中文和其他语言。
三、布尔型
和其他编程语言一样,Python布尔类型也是用于逻辑运算,有两个值:True(真)和False(假)。
四、列表
列表是Python中使用最频繁的数据类型,集合中可以放任何数据类型,可对集合进行创建、查找、切片、增加、修改、删除、循环和排序操作。
五、元组
元组和列表一样,也是一种序列,与列表不同的是,元组是不可修改的,元组用”()”标识,内部元素用逗号隔开。
六、字典
字典是一种键值对的集合,是除列表以外Python之中最灵活的内置数据结构类型,列表是有序的对象集合,字典是无序的对象集合。
七、集合
集合是一个无序的、不重复的数据组合,它的主要作用有两个,分别是去重和关系测试。