python百度文库doc(python下载百度文库收费文档)

http://www.itjxue.com  2023-04-11 02:18  来源:未知  点击次数: 

如何用Python实现doc文件批量转换为docx

有一批PDF文件,好几百个,每个只打印第2,3页,双面打印。

网上搜索一波,方案如下:

安装Ghostscript,GhostView,使用gsprint命令打印pdf文件。

gsprint命令参数说明:

"-dQUIET", 安静的意思,指代执行过程中尽可能少的输出日志等信息。(也可以简写为“-q”)

"-dNOSAFER", 通过命令行运行

"-dBATCH", 执行到最后一页后退出

"-dNOPAUSE", 每一页转换之间没有停顿

"-dNOPROMPT", 没有相关提示

"-dFirstPage=1", 从第几页开始

"-dLastPage=5", 到第几页结束

"-sDEVICE=pngalpha", 转换输出的文件类型装置,默认值为x11alpha

"-g720x1280", 图片像素(-gx),一般不指定,使用默认输出

"-r300", 图片分辨率(即图片解析度为300dpi),默认值好像是72(未测试证实)

"-sOutputFile=/opt/shanhy/error1png/%d.png", 图片输出路径,使用%d或%ld输出页数

比如打印c.pdf第2,3页,命令如下

gsprint -dFirstPage=2 -dLastPage=3 c.pdf

大部分pdf只打印第2,第3页,双面打印,所以用python控制批量打印所有pdf的第二页,暂停,提示翻页,然后批量打印第三页。

完整代码如下

#-*- coding: utf-8 -*-

importosimporttimedefprint_pdf(pdf_file_name, page):"""静默打印pdf

:param pdf_file_name

:page 打印第几页

:return:"""cmd= 'gsprint -dFirstPage=%s -dLastPage=%s %s' %(page, page, pdf_file_name)print(cmd)

p=os.popen(cmd)

time.sleep(3)print(p.read())if __name__ == '__main__':

curr_path=os.getcwd()

fl=os.listdir(curr_path)for i in range(2,4):print(i)for f infl:if 'pdf' inf.lower():

print_pdf(f, i)

python设置word文档格式内容

import docx

doc=docx.Document()

整数 0 表示标题是 Title 样式,这用于文档的顶部。整数 1 到 45是不同的标题层次,是主要的标题, 45是最低层的子标题。

doc.add_heading('标题0',0)

doc.add_heading('标题1',1)

doc.add_heading('标题2',2)

doc.add_heading('标题3',3)

doc.add_heading('标题4',4)

doc.add_heading('标题5',5)

doc.save('example3.docx')

1# 添加内容

paragraph = doc_.add_paragraph()

run_ = paragraph.add_run("Python 博客")

2# 获取字体对象

font_ = run_.font

3# 设置下划线

font_.underline = True

4# 设置加粗

font_.bold = True

5# 设置字体颜色

font_.color.rgb = RGBColor(0xFF,0x00,0x00)

6# 设置字体大小

font_.size = Pt(20)

7# 获取段落格式

paragraph_format = paragraph.paragraph_format

8# 设置首行缩进

paragraph_format.first_line_indent = Inches(0.2)

9# 设置段前距,单位为英镑

paragraph_format.space_after = Pt(10)

10# 设置段后距,单位为英镑

paragraph_format.space_before = Pt(5)

11# 添加表格

table_ = doc_.add_table(rows=2, cols=2, style="Medium Grid 1 Accent 1")

12# 填写第一行第一列内容

table_.cell(0,0).text ="

13# 填写第一行第二列内容

table_.cell(0,1).text =""

14# 填写第二行第一列内容

table_.cell(1,0).text ="描述"

15# 填写第二行第二列内容

table_.cell(1,1).text =""

16# 添加图片、width 属性设置大小

doc_.add_picture(r"/usr/load/download/test.png", width=Inches(4.25))

17# 保存文档

doc_.save('Python--Word 内容格式.docx')

python中的_doc_是什么意思?

您好,首先您描述有误,应该是__doc__,双下划线。

每个对象都会有一个__doc__属性,用于描述该对象的作用。在一个模块被import时,其文件中的某些特殊的字符串会被python解释器保存在相应对象的__doc__属性中。比如,一个模块有模块的__doc__,一个class或function也有其对应的__doc__属性。在python中,一个模块其实就是一个.py文件。在文件中特殊的地方书写的字符串就是所谓的docstrings,就是将被放到__doc__的内容。这个“特殊的地方”包括:

1.?一个文件任何一条可执行的代码之前? #模块的__doc__

2.?一个类,在类定义语句后,任何可执行代码前#类的__doc__

3.?一个函数,在函数定义语句后,任何可执行代码前#函数的__doc__

举个例子:

#use??__doc__?属性

class?MyClass:

????'string.'

????def?printSay():

????????'print?say?welcome?to?you.'

????????print?'say?welcome?to?you.'

print?MyClass.__doc__

print?MyClass.printSay.__doc__

?

#输出结果

?string.

print?say?welcome?to?you.

python pydoc查看文档

1、首先打开命令行,在dos窗口输入:

python -m pydoc -p 4567

-m pydoc表示打开pydoc模块,pydoc是查看python文档的首选工具;

-p 4567表示在4567端口上启动server;

2、然后在浏览器中访问 ,此时应该可以看到python中所有的Modules

3、按ctrl+f,输入selenium,定位到selenium文档的链接,然后点击进入到 这个页面

这就是selenium文档所在的位置了,

4、接下来便可以根据自己的需要进行查看了。举个例子,

如果你想查看Webdriver类的基本方法,可以访问这个页面

python doc文件怎么打开

使用python idld的时候按F1就是,否则直接到python安装目录下doc文件夹下打开文件

(责任编辑:IT教学网)

更多