python怎么输出文件内容(python如何输出文件内容)

http://www.itjxue.com  2023-03-24 22:40  来源:未知  点击次数: 

python输出word内容

程序导出word文档的方法

将web/html内容导出为world文档,再java中有很多解决方案,比如使用Jacob、Apache POI、Java2Word、iText等各种方式,以及使用freemarker这样的模板引擎这样的方式。php中也有一些相应的方法,但在python中将web/html内容生成world文档的方法是很少的。其中最不好解决的就是如何将使用js代码异步获取填充的数据,图片导出到word文档中。

1. unoconv

功能:

1.支持将本地html文档转换为docx格式的文档,所以需要先将网页中的html文件保存到本地,再调用unoconv进行转换。转换效果也不错,使用方法非常简单。

\# 安装

sudo apt-get install unoconv

\# 使用

unoconv -f pdf *.odt

unoconv -f doc *.odt

unoconv -f html *.odt

缺点:

1.只能对静态html进行转换,对于页面中有使用ajax异步获取数据的地方也不能转换(主要是要保证从web页面保存下来的html文件中有数据)。

2.只能对html进行转换,如果页面中有使用echarts,highcharts等js代码生成的图片,是无法将这些图片转换到word文档中;

3.生成的word文档内容格式不容易控制。

2. python-docx

功能:

1.python-docx是一个可以读写word文档的python库。

使用方法:

1.获取网页中的数据,使用python手动排版添加到word文档中。

from docx import Document

from docx.shared import Inches

document = Document()

document.add_heading('Document Title', 0)

p = document.add_paragraph('A plain paragraph having some ')

p.add_run('bold').bold = True

p.add_run(' and some ')

p.add_run('italic.').italic = True

document.add_heading('Heading, level 1', level=1)

document.add_paragraph('Intense quote', style='IntenseQuote')

document.add_paragraph(

'first item in unordered list', style='ListBullet'

)

document.add_paragraph(

'first item in ordered list', style='ListNumber'

)

document.add_picture('monty-truth.png', width=Inches(1.25))

table = document.add_table(rows=1, cols=3)

hdr_cells = table.rows[0].cells

hdr_cells[0].text = 'Qty'

hdr_cells[1].text = 'Id'

hdr_cells[2].text = 'Desc'

for item in recordset:

row_cells = table.add_row().cells

row_cells[0].text = str(item.qty)

row_cells[1].text = str(item.id)

row_cells[2].text = item.desc

document.add_page_break()

document.save('demo.docx')

from docx import Document

from docx.shared import Inches

document = Document()

for row in range(9):

t = document.add_table(rows=1,cols=1,style = 'Table Grid')

t.autofit = False #很重要!

w = float(row) / 2.0

t.columns[0].width = Inches(w)

document.save('table-step.docx')

缺点:

1.功能非常弱。有很多限制比如不支持模板等,只能生成简单格式的word文档。

程序导出PDF文档方法

1.pdfkit

功能:

1.wkhtmltopdf主要用于HTML生成PDF。

2.pdfkit是基于wkhtmltopdf的python封装,支持URL,本地文件,文本内容到PDF的转换,其最终还是调用wkhtmltopdf命令。是目前接触到的python生成pdf效果较好的。

优点:

1.wkhtmltopdf:利用webkit内核将HTML转为PDF

webkit是一个高效、开源的浏览器内核,包括Chrome和Safari在内的浏览器都使用了这个内核。Chrome打印当前网页的功能,其中有一个选项就是直接“保存为 PDF”。

2.wkhtmltopdf使用webkit内核的PDF渲染引擎来将HTML页面转换为PDF。高保真,转换质量很好,且使用非常简单。

使用方法:

\# 安装

pip install pdfkit

\# 使用

import pdfkit

pdfkit.from_url('', 'out.pdf')

pdfkit.from_file('test.html', 'out.pdf')

pdfkit.from_string('Hello!', 'out.pdf')

缺点:

1.对使用echarts,highcharts这样的js代码生成的图标无法转换为pdf(因为它的功能主要是将html转换为pdf,而不是将js转换为pdf)。对于纯静态页面的转换效果还是不错的。

2.其他

其他生成pdf的插件还有:weasyprint,reportlab,PyPDF2等,经简单试验都不如pdfkit效果好,且有些用法复杂。

python 文件内容处理后输出

首先确认下,你确定格式正确吗?你写的逻辑是,输出的第二行是第一行的内容加上第二行的内容, 第三行的内容是1,2,3行相加的内容, 这样累加,文件当然大了,

至于内存不足,你的写法很有问题,学python时间不长吧,没有人用python这些写循环来迭代列表的

更好的写法是:

lines?=?open('exp.100','r').readlines()

out?=?open("out",'w')

output1?=?[]

for?i?in?lines:

????output1.append('set([('+lines[i].replace('\n',')])\n').replace('?','),?(').replace('-',',?'))

????for?k?in?output1:

????????out.write(output1[k])

python中怎么输入输出文件

1.打开和关闭文件(open(),file(),close())

有两种内建函数可以获取文件对象:open和file。他们的用法完全一样。下面只以open()为例子讲解。获取一个文件对象(打开文件)的语法如下:

复制代码 代码如下:fileObj = open(filename,access_mode='r',buffering=-1)

filename不用说你也应该知道是你要打开文件的路径。

access_mode用来标识文件打开的模式,默认为r(只读)。

常用的模式如下表所示:

文件模式 解释

r 以只读方式打开

w 以写方式打开,文件不为空时清空文件;文件不存在时新建文件。

a 追加模式,没有则创建

r+,w+,a+ 以读写模式打开,参见w,a

另外还有一个b表示二进制模式访问,但是对于Linux或者unix系统来说这个模式没有任何意义,因为他们把所有文件都看作二进制文件,包括文本文件。

第三个参数不经常用到,标识访问文件的缓冲方式,0代表不缓冲,1代表缓

冲一行,-1代表使用系统默认缓冲方式。只要使用系统默认就好。

一些例子:

复制代码 代码如下:

f = open('/etc/passwd','r')

f1 = open('/etc/test','w')

使用完文件后,一定要记得关闭文件,操作如下:

复制代码 代码如下:

f.close()

2.文件读入

2.1.file.read(size = -1)

读取从当前文件游标起size个字节的文件内容。如果size=-1,则读取所有剩余字节。

复制代码 代码如下:

f = open('/etc/passwd')

f.read(100)

'root:x:0:0:root:/root:/bin/bash\nbin:x:1:1:bin:/bin:/sbin/nologin\ndaemon:x:2:2:daemon:/sbin:/sbin/nol'

2.2.file.readlines(size=-1)

从文件中读取并返回一行(包括行结束符),或返回最大size个字符

复制代码 代码如下:

f.readline()

'ogin\n'#和上面一个例子输出的最后拼起来就是 'nologin',因为游标在l后面。

f.readline(1)

'a'

2.3.file.readlines(sizhint=0)

读取文件所有的行,并作为一个列表返回(包括行结束符),如果sizhint0则返回总和大约sizhint字节的行(具体由缓冲区大小决定)。

复制代码 代码如下:

f.readlines()

['dm:x:3:4:adm:/var/adm:/sbin/nologin\n', 'lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin\n', 'sync:x:5:0:sync:/sbin:/bin/sync\n', 'shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown\n', 'halt:x:7:0:halt:/sbin:/sbin/halt\n', 'mail:x:8:12:mail:/var/spool/mail:/sbin/nologin\n', ......

输出省略。

3.文件输出

3.1.file.write(str)

向文件中写入指定的字符串。

复制代码 代码如下:

f = file('/root/test.py','w+')

f.write("print 'hello,world'")

f.read()

''

f.close()

file('/root/test.py','r').read()

"print 'hello,world'"

3.2.file.write(seq)

向文件写入字符串序列seq。seq是任何返回字符串的可迭代对象。

复制代码 代码如下:

f = file('/root/test.py','a+')

codelst = ['\n','import os\n',"os.popen('ls').read()\n"]

f.writelines(codelst)

f.close()

file('/root/test.py','r').read()

"print 'hello,world'\nimport os\nos.popen('ls').read()\n"

注意,文件写入的时候,不会自动加上换行符,必须手动加上。

Python 文件操作

open(filename[,mode,encoding="编码"]) :第一个参数文件名如果不加路径,默认在该py文件目录下(路径举例: E:/XXX或E:\\xxx ),第二个是模式,默认为 'r' ——只读,举例: f = open('E:/abc.txt') ,如果要转编码并写入模式:

f = open('E:/abc.txt','w',encoding='utf-8')

1. 模式

2. 方法

(1) close() : 关闭文件,因为文件写入时是写在内存,只有关闭时才写入硬盘,所以写完记得关闭

(2) read(size = -1) :读取文件size个字符,不写默认是-1,此时读取所有内容(换行按\n来表示,很不好看),并作为字符串返回,一定要注意 读完以后文件指针将会指向末尾 ,所以下一次在用read方法时会发现读取不出内容了,所以这个就要用seek移动指针或者关闭文件重新定义

(3) tell() :返回当前文件指针指向的位置

(4) seek(offset,from) :移动文件指针,代表从from参数开始偏移offset个字节,0代表起始位置,1代表当前位置,2代表文件末尾

(5) readline() :按序列读取一行内容,默认\n为边界

(6) write() :写入内容,但必须要有写入权限才行,否则报错,写完会返回写入的长度,例如: len1 = f.write('abc') ,此时len1就为3

(7) truncate() :删除内容,把当前指针以后的内容全删了,举例:

注:

1.文件还可以转化为 list 之类的,例如: list1 = list(f) ,此时文件内容的按\n被隔开,然后可以用for语句读取文件所有内容,举例:

2.上面输出文件内容方法相对低效,所以一般都直接用for输出整个文件,举例:

通过 fileno 函数,我们可以查看一个文件对应的文件描述符,对应的是程序中打开的文件序号,举例:

可以看出python在启动时会先启动标准流的文件(文件描述符分别为:0/1/2),所以之后打开的文件就从3开始递增,当释放一个文件资源时,该描述符序号被释放,之后打开的文件可以继续使用该序号的文件描述符

python中的 print 的本质是通过 sys.stdout 来进行内容输出,而 sys.stdout 的本质是一个"文件",相当于我们所有的输入输出的本质都是在对 sys.stdin / sys.stdout / sys.stderr 这些文件来进行读写操作,举例:

open 函数不仅可以打开本地文件,也可以打开文件描述符,而该参数默认为 True ,代表 close 后会将对应的文件资源释放,而对于一些文件描述符,我们只是希望 close 时将打开文件描述符的对象释放,而不释放对应的文件资源,那么则可以设置 closefd=False ,举例:

需要使用到 chardet 模块,按二进制可读打开文件,然后通过 detect() 方法查看,举例:

所以就可以根据文件来设置编码了:

有时候使用文件的编码解码也可能会出现无法解析的情况,例如两种编码混在同一个文件里的时候,此时可以设置 errors 参数为 ignore 来避免该问题,示例:

可用 os 模块下的 chmod() 函数,具体参考:

使用 os 模块下的 remove() 函数可以实现删除文件,举例:

可以使用自带的 zipfile 模块来进行操作,举例:

可以使用自带的 tarfile 模块来进行操作,举例:

python怎么把数据输出到excel

python导出数据到excel文件的方法:

1、调用Workbook()对象中的add_sheet()方法

1

2

wb = xlwt.Workbook()

ws = wb.add_sheet('A Test Sheet')

2、通过add_sheet()方法中的write()函数将数据写入到excel中,然后使用save()函数保存excel文件

1

2

3

4

5

6

7

ws.write(0, 0, 1234.56, style0)

ws.write(1, 0, datetime.now(), style1)

ws.write(2, 0, 1)

ws.write(2, 1, 1)

ws.write(2, 2, xlwt.Formula("A3+B3"))

wb.save('example.xls')

完整代码如下:

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

import xlwtfrom datetime import datetime

style0 = xlwt.easyxf('font: name Times New Roman, color-index red, bold on',num_format_str='#,##0.00')

style1 = xlwt.easyxf(num_format_str='D-MMM-YY')

wb = xlwt.Workbook()

ws = wb.add_sheet('A Test Sheet')

ws.write(0, 0, 1234.56, style0)

ws.write(1, 0, datetime.now(), style1)

ws.write(2, 0, 1)

ws.write(2, 1, 1)

ws.write(2, 2, xlwt.Formula("A3+B3"))

wb.save('example.xls')

程序执行结果如下:

更多Python知识,请关注:Python自学网!!

(推荐操作系统:windows7系统、Python 3.9.1,DELL G3电脑。)

(责任编辑:IT教学网)

更多

推荐免费资源文章