当前位置： > 网站建设 > 其他源码 > 文章内容

python处理csv文件绘制曲线(csv在python)

http://www.itjxue.com 2023-03-31 12:15 来源:未知 点击次数:

Python大数据，一些简单的操作

#coding:utf-8

#file: FileSplit.py

import os,os.path,time

def FileSplit(sourceFile, targetFolder):

sFile = open(sourceFile, 'r')

number = 100000 #每个小文件中保存100000条数据

dataLine = sFile.readline()

tempData = [] #缓存列表

fileNum = 1

if not os.path.isdir(targetFolder): #如果目标目录不存在，则创建

os.mkdir(targetFolder)

while dataLine: #有数据

for row in range(number):

tempData.append(dataLine) #将一行数据添加到列表中

dataLine = sFile.readline()

if not dataLine :

break

tFilename = os.path.join(targetFolder,os.path.split(sourceFile)[1] + str(fileNum) + ".txt")

tFile = open(tFilename, 'a+') #创建小文件

tFile.writelines(tempData) #将列表保存到文件中

tFile.close()

tempData = [] #清空缓存列表

print(tFilename + " 创建于: " + str(time.ctime()))

fileNum += 1 #文件编号

sFile.close()

if __name__ == "__main__" :

FileSplit("access.log","access")

#coding:utf-8

#file: Map.py

import os,os.path,re

def Map(sourceFile, targetFolder):

sFile = open(sourceFile, 'r')

dataLine = sFile.readline()

tempData = {} #缓存列表

if not os.path.isdir(targetFolder): #如果目标目录不存在，则创建

os.mkdir(targetFolder)

while dataLine: #有数据

p_re = re.compile(r'(GET|POST)\s(.*?)\sHTTP/1.[01]',re.IGNORECASE) #用正则表达式解析数据

match = p_re.findall(dataLine)

if match:

visitUrl = match[0][1]

if visitUrl in tempData:

tempData[visitUrl] += 1

else:

tempData[visitUrl] = 1

dataLine = sFile.readline() #读入下一行数据

sFile.close()

tList = []

for key,value in sorted(tempData.items(),key = lambda k:k[1],reverse = True):

tList.append(key + " " + str(value) + '\n')

tFilename = os.path.join(targetFolder,os.path.split(sourceFile)[1] + "_map.txt")

tFile = open(tFilename, 'a+') #创建小文件

tFile.writelines(tList) #将列表保存到文件中

tFile.close()

if __name__ == "__main__" :

Map("access\\access.log1.txt","access")

Map("access\\access.log2.txt","access")

Map("access\\access.log3.txt","access")

#coding:utf-8

#file: Reduce.py

import os,os.path,re

def Reduce(sourceFolder, targetFile):

tempData = {} #缓存列表

p_re = re.compile(r'(.*?)(\d{1,}$)',re.IGNORECASE) #用正则表达式解析数据

for root,dirs,files in os.walk(sourceFolder):

for fil in files:

if fil.endswith('_map.txt'): #是reduce文件

sFile = open(os.path.abspath(os.path.join(root,fil)), 'r')

dataLine = sFile.readline()

while dataLine: #有数据

subdata = p_re.findall(dataLine) #用空格分割数据

#print(subdata[0][0]," ",subdata[0][1])

if subdata[0][0] in tempData:

tempData[subdata[0][0]] += int(subdata[0][1])

else:

tempData[subdata[0][0]] = int(subdata[0][1])

dataLine = sFile.readline() #读入下一行数据

sFile.close()

tList = []

for key,value in sorted(tempData.items(),key = lambda k:k[1],reverse = True):

tList.append(key + " " + str(value) + '\n')

tFilename = os.path.join(sourceFolder,targetFile + "_reduce.txt")

tFile = open(tFilename, 'a+') #创建小文件

tFile.writelines(tList) #将列表保存到文件中

tFile.close()

if __name__ == "__main__" :

Reduce("access","access")

利用Python分析处理数据。学校大数据课程，十几年第一次开，有没有精通计算机的哥哥姐姐帮助一下。

想要系统学习数据分析，建议一定要看的数据分析圣经《利用python进行数据分析》，这本书有理论有实践，深入浅出，层层递进，适合刚入门的数据分析小白，或者还有另外一本《python机器学习基础教程》，也是比较入门级的，不过更偏向于机器学习的方向，但是也是涉及比较基础的内容，可以作为进阶来学习。手打不容易，以上回答如有帮助请采纳，谢谢！

python处理csv文件绘制曲线(csv在python)

python 批量处理csv数据，并进行数据分析，绘制基本散点图

用os模块得到目录下的所有csv文件，然后将已经处理过的csv文件名存到一个文件中，每次得到目录下所有csv文件名列表，如果不在已经处理的csv文件名列表中，则使用你的方法将数据提取出来，并将相应的csv文件名加入到已经处理的csv文件名列表中。

python导入csv并利用其中数据画图

昨天手机看的，没看到你发的表格，抱歉。给你写个简单的。

import pandas

import matplotlib.pyplot as plt

# sep这是是分割符，具体看你自己的文件分割是用什么，usecoles是取a,b,c三列

a_b_c = pandas.read_csv("这里写你的文件地址", sep="\t", usecols=[1,2,3])

# 取c在3000到10000的行

a = a_b_c[(a_b_c['c']=3000) (a_b_c['c']=10000)]

a_col = a["a"]

b_col = a["b"]

plt.scatter(a_col, b_col)

plt.show()

流程大概是这样，具体需要细化的地方看官方文档或者百度查询。

(责任编辑：IT教学网)

复制链接发给好友收藏本文关闭此页

上一篇：it学什么专业好(it学什么技术有前途)

下一篇：编程下载(scratch少儿编程下载)

python处理csv文件绘制曲线(csv在python)

Python大数据，一些简单的操作

利用Python分析处理数据。学校大数据课程，十几年第一次开，有没有精通计算机的哥哥姐姐帮助一下。

python 批量处理csv数据，并进行数据分析，绘制基本散点图

python导入csv并利用其中数据画图

(责任编辑：IT教学网)

相关其他源码文章

阅读排行

专题教程

推荐其他源码文章

最新更新其他源码

python处理csv文件绘制曲线(csv在python)

Python大数据， 一些简单的操作

利用Python分析处理数据。学校大数据课程，十几年第一次开，有没有精通计算机的哥哥姐姐帮助一下。

python 批量处理csv数据，并进行数据分析，绘制基本散点图

python导入csv并利用其中数据画图

(责任编辑：IT教学网)

相关其他源码文章

阅读排行

专题教程

推荐其他源码文章

最新更新其他源码

Python大数据，一些简单的操作