python百度文库doc(python下载百度文库收费文档)
如何用Python实现doc文件批量转换为docx
有一批PDF文件,好几百个,每个只打印第2,3页,双面打印。
网上搜索一波,方案如下:
安装Ghostscript,GhostView,使用gsprint命令打印pdf文件。
gsprint命令参数说明:
"-dQUIET", 安静的意思,指代执行过程中尽可能少的输出日志等信息。(也可以简写为“-q”)
"-dNOSAFER", 通过命令行运行
"-dBATCH", 执行到最后一页后退出
"-dNOPAUSE", 每一页转换之间没有停顿
"-dNOPROMPT", 没有相关提示
"-dFirstPage=1", 从第几页开始
"-dLastPage=5", 到第几页结束
"-sDEVICE=pngalpha", 转换输出的文件类型装置,默认值为x11alpha
"-g720x1280", 图片像素(-gx),一般不指定,使用默认输出
"-r300", 图片分辨率(即图片解析度为300dpi),默认值好像是72(未测试证实)
"-sOutputFile=/opt/shanhy/error1png/%d.png", 图片输出路径,使用%d或%ld输出页数
比如打印c.pdf第2,3页,命令如下
gsprint -dFirstPage=2 -dLastPage=3 c.pdf
大部分pdf只打印第2,第3页,双面打印,所以用python控制批量打印所有pdf的第二页,暂停,提示翻页,然后批量打印第三页。
完整代码如下
#-*- coding: utf-8 -*-
importosimporttimedefprint_pdf(pdf_file_name, page):"""静默打印pdf
:param pdf_file_name
:page 打印第几页
:return:"""cmd= 'gsprint -dFirstPage=%s -dLastPage=%s %s' %(page, page, pdf_file_name)print(cmd)
p=os.popen(cmd)
time.sleep(3)print(p.read())if __name__ == '__main__':
curr_path=os.getcwd()
fl=os.listdir(curr_path)for i in range(2,4):print(i)for f infl:if 'pdf' inf.lower():
print_pdf(f, i)
python设置word文档格式内容
import docx
doc=docx.Document()
整数 0 表示标题是 Title 样式,这用于文档的顶部。整数 1 到 45是不同的标题层次,是主要的标题, 45是最低层的子标题。
doc.add_heading('标题0',0)
doc.add_heading('标题1',1)
doc.add_heading('标题2',2)
doc.add_heading('标题3',3)
doc.add_heading('标题4',4)
doc.add_heading('标题5',5)
doc.save('example3.docx')
1# 添加内容
paragraph = doc_.add_paragraph()
run_ = paragraph.add_run("Python 博客")
2# 获取字体对象
font_ = run_.font
3# 设置下划线
font_.underline = True
4# 设置加粗
font_.bold = True
5# 设置字体颜色
font_.color.rgb = RGBColor(0xFF,0x00,0x00)
6# 设置字体大小
font_.size = Pt(20)
7# 获取段落格式
paragraph_format = paragraph.paragraph_format
8# 设置首行缩进
paragraph_format.first_line_indent = Inches(0.2)
9# 设置段前距,单位为英镑
paragraph_format.space_after = Pt(10)
10# 设置段后距,单位为英镑
paragraph_format.space_before = Pt(5)
11# 添加表格
table_ = doc_.add_table(rows=2, cols=2, style="Medium Grid 1 Accent 1")
12# 填写第一行第一列内容
table_.cell(0,0).text ="
13# 填写第一行第二列内容
table_.cell(0,1).text =""
14# 填写第二行第一列内容
table_.cell(1,0).text ="描述"
15# 填写第二行第二列内容
table_.cell(1,1).text =""
16# 添加图片、width 属性设置大小
doc_.add_picture(r"/usr/load/download/test.png", width=Inches(4.25))
17# 保存文档
doc_.save('Python--Word 内容格式.docx')
python中的_doc_是什么意思?
您好,首先您描述有误,应该是__doc__,双下划线。
每个对象都会有一个__doc__属性,用于描述该对象的作用。在一个模块被import时,其文件中的某些特殊的字符串会被python解释器保存在相应对象的__doc__属性中。比如,一个模块有模块的__doc__,一个class或function也有其对应的__doc__属性。在python中,一个模块其实就是一个.py文件。在文件中特殊的地方书写的字符串就是所谓的docstrings,就是将被放到__doc__的内容。这个“特殊的地方”包括:
1.?一个文件任何一条可执行的代码之前? #模块的__doc__
2.?一个类,在类定义语句后,任何可执行代码前#类的__doc__
3.?一个函数,在函数定义语句后,任何可执行代码前#函数的__doc__
举个例子:
#use??__doc__?属性
class?MyClass:
????'string.'
????def?printSay():
????????'print?say?welcome?to?you.'
????????print?'say?welcome?to?you.'
print?MyClass.__doc__
print?MyClass.printSay.__doc__
?
#输出结果
?string.
print?say?welcome?to?you.
python pydoc查看文档
1、首先打开命令行,在dos窗口输入:
python -m pydoc -p 4567
-m pydoc表示打开pydoc模块,pydoc是查看python文档的首选工具;
-p 4567表示在4567端口上启动server;
2、然后在浏览器中访问 ,此时应该可以看到python中所有的Modules
3、按ctrl+f,输入selenium,定位到selenium文档的链接,然后点击进入到 这个页面
这就是selenium文档所在的位置了,
4、接下来便可以根据自己的需要进行查看了。举个例子,
如果你想查看Webdriver类的基本方法,可以访问这个页面
python doc文件怎么打开
使用python idld的时候按F1就是,否则直接到python安装目录下doc文件夹下打开文件