当前位置： > 网站运营 > 免费资源 > 文章内容

python怎么输出文件内容(python如何输出文件内容)

http://www.itjxue.com 2023-03-24 22:40 来源:未知 点击次数:

python输出word内容

程序导出word文档的方法

将web/html内容导出为world文档，再java中有很多解决方案，比如使用Jacob、Apache POI、Java2Word、iText等各种方式，以及使用freemarker这样的模板引擎这样的方式。php中也有一些相应的方法，但在python中将web/html内容生成world文档的方法是很少的。其中最不好解决的就是如何将使用js代码异步获取填充的数据，图片导出到word文档中。

1. unoconv

功能：

1.支持将本地html文档转换为docx格式的文档，所以需要先将网页中的html文件保存到本地，再调用unoconv进行转换。转换效果也不错，使用方法非常简单。

\# 安装

sudo apt-get install unoconv

\# 使用

unoconv -f pdf *.odt

unoconv -f doc *.odt

unoconv -f html *.odt

缺点：

1.只能对静态html进行转换，对于页面中有使用ajax异步获取数据的地方也不能转换（主要是要保证从web页面保存下来的html文件中有数据）。

2.只能对html进行转换，如果页面中有使用echarts,highcharts等js代码生成的图片，是无法将这些图片转换到word文档中；

3.生成的word文档内容格式不容易控制。

2. python-docx

功能：

1.python-docx是一个可以读写word文档的python库。

使用方法：

1.获取网页中的数据，使用python手动排版添加到word文档中。

from docx import Document

from docx.shared import Inches

document = Document()

document.add_heading('Document Title', 0)

p = document.add_paragraph('A plain paragraph having some ')

p.add_run('bold').bold = True

p.add_run(' and some ')

p.add_run('italic.').italic = True

document.add_heading('Heading, level 1', level=1)

document.add_paragraph('Intense quote', style='IntenseQuote')

document.add_paragraph(

'first item in unordered list', style='ListBullet'

)

document.add_paragraph(

'first item in ordered list', style='ListNumber'

)

document.add_picture('monty-truth.png', width=Inches(1.25))

table = document.add_table(rows=1, cols=3)

hdr_cells = table.rows[0].cells

hdr_cells[0].text = 'Qty'

hdr_cells[1].text = 'Id'

hdr_cells[2].text = 'Desc'

for item in recordset:

row_cells = table.add_row().cells

row_cells[0].text = str(item.qty)

row_cells[1].text = str(item.id)

row_cells[2].text = item.desc

document.add_page_break()

document.save('demo.docx')

from docx import Document

from docx.shared import Inches

document = Document()

for row in range(9):

t = document.add_table(rows=1,cols=1,style = 'Table Grid')

t.autofit = False #很重要！

w = float(row) / 2.0

t.columns[0].width = Inches(w)

document.save('table-step.docx')

缺点：

1.功能非常弱。有很多限制比如不支持模板等，只能生成简单格式的word文档。

程序导出PDF文档方法

1.pdfkit

功能：

1.wkhtmltopdf主要用于HTML生成PDF。

2.pdfkit是基于wkhtmltopdf的python封装，支持URL，本地文件，文本内容到PDF的转换，其最终还是调用wkhtmltopdf命令。是目前接触到的python生成pdf效果较好的。

优点：

1.wkhtmltopdf：利用webkit内核将HTML转为PDF

webkit是一个高效、开源的浏览器内核，包括Chrome和Safari在内的浏览器都使用了这个内核。Chrome打印当前网页的功能，其中有一个选项就是直接“保存为 PDF”。

2.wkhtmltopdf使用webkit内核的PDF渲染引擎来将HTML页面转换为PDF。高保真，转换质量很好，且使用非常简单。

使用方法：

\# 安装

pip install pdfkit

\# 使用

import pdfkit

pdfkit.from_url('', 'out.pdf')

pdfkit.from_file('test.html', 'out.pdf')

pdfkit.from_string('Hello!', 'out.pdf')

缺点：

1.对使用echarts，highcharts这样的js代码生成的图标无法转换为pdf（因为它的功能主要是将html转换为pdf,而不是将js转换为pdf）。对于纯静态页面的转换效果还是不错的。

2.其他

其他生成pdf的插件还有：weasyprint，reportlab，PyPDF2等，经简单试验都不如pdfkit效果好，且有些用法复杂。

python 文件内容处理后输出

首先确认下,你确定格式正确吗?你写的逻辑是,输出的第二行是第一行的内容加上第二行的内容, 第三行的内容是1,2,3行相加的内容, 这样累加,文件当然大了,

至于内存不足,你的写法很有问题,学python时间不长吧,没有人用python这些写循环来迭代列表的

更好的写法是:

lines?=?open('exp.100','r').readlines()

out?=?open("out",'w')

output1?=?[]

for?i?in?lines:

????output1.append('set([('+lines[i].replace('\n',')])\n').replace('?','),?(').replace('-',',?'))

????for?k?in?output1:

????????out.write(output1[k])

python怎么输出文件内容(python如何输出文件内容)

python中怎么输入输出文件

1.打开和关闭文件（open(),file(),close()）

有两种内建函数可以获取文件对象：open和file。他们的用法完全一样。下面只以open()为例子讲解。获取一个文件对象（打开文件）的语法如下：

复制代码代码如下:fileObj = open(filename,access_mode='r',buffering=-1)

filename不用说你也应该知道是你要打开文件的路径。

access_mode用来标识文件打开的模式，默认为r(只读)。

常用的模式如下表所示：

文件模式解释

r 以只读方式打开

w 以写方式打开，文件不为空时清空文件;文件不存在时新建文件。

a 追加模式，没有则创建

r+,w+,a+ 以读写模式打开，参见w,a

另外还有一个b表示二进制模式访问，但是对于Linux或者unix系统来说这个模式没有任何意义，因为他们把所有文件都看作二进制文件，包括文本文件。

第三个参数不经常用到，标识访问文件的缓冲方式，0代表不缓冲，1代表缓

冲一行，-1代表使用系统默认缓冲方式。只要使用系统默认就好。

一些例子：

复制代码代码如下:

f = open('/etc/passwd','r')

f1 = open('/etc/test','w')

使用完文件后，一定要记得关闭文件，操作如下：

复制代码代码如下:

f.close()

2.文件读入

2.1.file.read(size = -1)

读取从当前文件游标起size个字节的文件内容。如果size=-1，则读取所有剩余字节。

复制代码代码如下:

f = open('/etc/passwd')

f.read(100)

'root:x:0:0:root:/root:/bin/bash\nbin:x:1:1:bin:/bin:/sbin/nologin\ndaemon:x:2:2:daemon:/sbin:/sbin/nol'

2.2.file.readlines(size=-1)

从文件中读取并返回一行（包括行结束符），或返回最大size个字符

复制代码代码如下:

f.readline()

'ogin\n'#和上面一个例子输出的最后拼起来就是 'nologin'，因为游标在l后面。

f.readline(1)

'a'

2.3.file.readlines(sizhint=0)

读取文件所有的行，并作为一个列表返回（包括行结束符），如果sizhint0则返回总和大约sizhint字节的行（具体由缓冲区大小决定）。

复制代码代码如下:

f.readlines()

['dm:x:3:4:adm:/var/adm:/sbin/nologin\n', 'lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin\n', 'sync:x:5:0:sync:/sbin:/bin/sync\n', 'shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown\n', 'halt:x:7:0:halt:/sbin:/sbin/halt\n', 'mail:x:8:12:mail:/var/spool/mail:/sbin/nologin\n', ......

输出省略。

3.文件输出

3.1.file.write(str)

向文件中写入指定的字符串。

复制代码代码如下:

f = file('/root/test.py','w+')

f.write("print 'hello,world'")

f.read()

f.close()

file('/root/test.py','r').read()

"print 'hello,world'"

3.2.file.write(seq)

向文件写入字符串序列seq。seq是任何返回字符串的可迭代对象。

复制代码代码如下:

f = file('/root/test.py','a+')

codelst = ['\n','import os\n',"os.popen('ls').read()\n"]

f.writelines(codelst)

f.close()

file('/root/test.py','r').read()

"print 'hello,world'\nimport os\nos.popen('ls').read()\n"

注意，文件写入的时候，不会自动加上换行符，必须手动加上。

Python 文件操作

open(filename[,mode,encoding="编码"]) ：第一个参数文件名如果不加路径，默认在该py文件目录下（路径举例： E:/XXX或E:\\xxx ），第二个是模式，默认为 'r' ——只读，举例： f = open('E:/abc.txt') ，如果要转编码并写入模式：

f = open('E:/abc.txt','w',encoding='utf-8')

1. 模式

2. 方法

(1) close() : 关闭文件，因为文件写入时是写在内存，只有关闭时才写入硬盘，所以写完记得关闭

(2) read(size = -1) ：读取文件size个字符，不写默认是-1，此时读取所有内容（换行按\n来表示，很不好看），并作为字符串返回，一定要注意读完以后文件指针将会指向末尾，所以下一次在用read方法时会发现读取不出内容了，所以这个就要用seek移动指针或者关闭文件重新定义

(3) tell() ：返回当前文件指针指向的位置

(4) seek(offset,from) ：移动文件指针，代表从from参数开始偏移offset个字节，0代表起始位置，1代表当前位置，2代表文件末尾

(5) readline() ：按序列读取一行内容，默认\n为边界

(6) write() ：写入内容，但必须要有写入权限才行，否则报错，写完会返回写入的长度，例如： len1 = f.write('abc') ，此时len1就为3

(7) truncate() ：删除内容，把当前指针以后的内容全删了，举例：

注：

1.文件还可以转化为 list 之类的，例如： list1 = list(f) ，此时文件内容的按\n被隔开，然后可以用for语句读取文件所有内容，举例：

2.上面输出文件内容方法相对低效，所以一般都直接用for输出整个文件，举例：

通过 fileno 函数，我们可以查看一个文件对应的文件描述符，对应的是程序中打开的文件序号，举例：

可以看出python在启动时会先启动标准流的文件（文件描述符分别为：0/1/2），所以之后打开的文件就从3开始递增，当释放一个文件资源时，该描述符序号被释放，之后打开的文件可以继续使用该序号的文件描述符

python中的 print 的本质是通过 sys.stdout 来进行内容输出，而 sys.stdout 的本质是一个"文件"，相当于我们所有的输入输出的本质都是在对 sys.stdin / sys.stdout / sys.stderr 这些文件来进行读写操作，举例：

open 函数不仅可以打开本地文件，也可以打开文件描述符，而该参数默认为 True ，代表 close 后会将对应的文件资源释放，而对于一些文件描述符，我们只是希望 close 时将打开文件描述符的对象释放，而不释放对应的文件资源，那么则可以设置 closefd=False ，举例：

需要使用到 chardet 模块，按二进制可读打开文件，然后通过 detect() 方法查看，举例：

所以就可以根据文件来设置编码了：

有时候使用文件的编码解码也可能会出现无法解析的情况，例如两种编码混在同一个文件里的时候，此时可以设置 errors 参数为 ignore 来避免该问题，示例：

可用 os 模块下的 chmod() 函数，具体参考：

使用 os 模块下的 remove() 函数可以实现删除文件，举例：

可以使用自带的 zipfile 模块来进行操作，举例：

可以使用自带的 tarfile 模块来进行操作，举例：

python怎么把数据输出到excel

python导出数据到excel文件的方法：

1、调用Workbook()对象中的add_sheet()方法

wb = xlwt.Workbook()

ws = wb.add_sheet('A Test Sheet')

2、通过add_sheet()方法中的write()函数将数据写入到excel中，然后使用save()函数保存excel文件

ws.write(0, 0, 1234.56, style0)

ws.write(1, 0, datetime.now(), style1)

ws.write(2, 0, 1)

ws.write(2, 1, 1)

ws.write(2, 2, xlwt.Formula("A3+B3"))

wb.save('example.xls')

完整代码如下：

import xlwtfrom datetime import datetime

style0 = xlwt.easyxf('font: name Times New Roman, color-index red, bold on',num_format_str='#,##0.00')

style1 = xlwt.easyxf(num_format_str='D-MMM-YY')

wb = xlwt.Workbook()

ws = wb.add_sheet('A Test Sheet')

ws.write(0, 0, 1234.56, style0)

ws.write(1, 0, datetime.now(), style1)

ws.write(2, 0, 1)

ws.write(2, 1, 1)

ws.write(2, 2, xlwt.Formula("A3+B3"))

wb.save('example.xls')

程序执行结果如下：

更多Python知识，请关注：Python自学网！！

（推荐操作系统：windows7系统、Python 3.9.1，DELL G3电脑。）

(责任编辑：IT教学网)

复制链接发给好友收藏本文关闭此页

上一篇：爬虫赌博软件用户信息违法吗(爬虫网站违法吗)

下一篇：赚钱的软件游戏一天能赚200(投资30元一小时赚600)

python怎么输出文件内容(python如何输出文件内容)

python输出word内容

python 文件内容处理后输出

python中怎么输入输出文件

Python 文件操作

python怎么把数据输出到excel

(责任编辑：IT教学网)

相关免费资源文章

阅读排行

专题教程

推荐免费资源文章

最新更新免费资源