当前位置： > 认证考试 > java认证 > 文章内容

python网页操作自动化脚本(python自动化操作浏览器)

http://www.itjxue.com 2023-04-01 15:03 来源:未知 点击次数:

想要用python3做个软件对网页自动化操作，需要搭建什么环境，如何实现？？？

只用python就行了啊。vs和pycharm都算是编辑器没什么关系啊，就是用记事本编辑也行哦。那就用pycharm吧，大家都吹嘘它好用。

就是用python的urllib模块请求网页就可以了。

登录就是post数据，然后获得cookie（可能还有一下其他的东西），带着它就可以做一些评论。

评论就是根据按钮找到相关的网页链接，向它post/get数据。

评论采集就是请求相关的网页，获得评论的数据，可能是html或者json之类的，然后用beautifulsoup或者json分析，获得格式化后的数据。

以前用Python做过一个空间的自动点赞、自动回复说说留言、获取留言的程序。

只要就是分析链接和js脚本费点时间。其他地方都简单。

PYTHON怎样编写自动化

就直接写脚本，给你举给例子：

编写工具：

1.设计目标：

首先说一下我要工具的功能：

遍历某个目录下包括其下子目录中所有指定的后缀文件，然后为这些文件的头部插入指定的字符串。

2.使用场景：

设计这样的工具起因是我最近在将之前 CSDN 中的博客搬运到自己的 Hexo 博客空间上，了解的应该知道，假如都是 Markdown 编写的话，搬运的时候只需要在文件头部加上如下的一串额外的内容：

---

title: 博客标题

date: 博客创建时间（例如：2016-09-03 17:15:22）

tags: 标签（如：[Hexo,Next]，多个的话用,号隔开）

categories: 分类(如：Web)

---123456

标题?title?直接使用文件名称去掉?.md?后缀即可；

时间?date?需要通过文件库获取文件的创建时间；

标签?tags?和分类?categories?，由于我的文件会根据分类放入不同的子目录下，所以直接获取当前文件所在目录的名称即可。

此外，为了在博客首页只展示部分内容，而不是展开博客的完整内容，还需要在博客中恰当的位置插入这个标签：!--more--?，通常加载第一段内容结束的位置。

3.实现代码：

根据上面的思路，我们在?source/_posts?目录下创建一个工具脚本，起名为?SuitFileToHexo.py?，然后依次完成以下步骤：

指定 Linux 环境下 Python 解释器目录，并指定编码方式：

#!/usr/bin/env python# -*- coding: utf-8 -*-

引入的模块：

在脚本开始的地方，最先需要做的事情就是把需要用到的模块都先引入进来，大致分析一下我们这个功能需要用到的模块：

import os.path,time

遍历当前目录下所有?.md?文件列表：

这就需要使用到 Python 的文件目录操作模块?os.path?，使用?os.listdir?获取目录列表，然后通过?os.path.splitext?分割文件名称和后缀名，从而筛选合格的文件：

# 获取指定目录指定后缀名的文件列表def getFileList(path,endStr):'''获取指定目录下，指定后缀的文件列表'''r_list = []

f_list = os.listdir(path) ? #获取目录列表for i in f_list: ? ?# 分离文件名和后缀名，过滤掉工具脚本

file_endStr = os.path.splitext(i)[1] ? ?# 判断是否是目录

if os.path.isdir(i):

f_list1 = os.listdir(path+'/'+i) ? ? ? ?for j in f_list1: ? ? ? ? ? ?# 过滤出指定后缀 endStr 后缀的文件

if os.path.splitext(j)[1] == endStr: ? ? ? ? ? ? ? ?# 为了清晰目录把文件所在目录也标识出来

r_list.append(i+'/'+j) ? ? ? ? ? ? ? ?# print j.decode("string_escape")

elif file_endStr == endStr:

r_list.append(i)return r_list

这里发现了一个问题，就是在?os.path.isdir(i)?在 2.7.11 的版本莫名其妙地返回 false，需要做如下修改才能正常：

if file_endStr == '':

i = os.path.join(path, i) ? #=================〉这一行很必要

# print i

# 判断是否是目录

if os.path.isdir(i):

...

获取文件的创建时间：

需要使用到?os.time?模块的功能：

# 获取文件创建时间def get_FileCreateTime(filePath):

t = os.path.getctime(filePath) ?return TimeStampToTime(t)# 把时间戳转化为时间: 1479264792 to 2016-11-16 10:53:12'''def TimeStampToTime(timestamp):

timeStruct = time.localtime(timestamp) ?return time.strftime('%Y-%m-%d %H:%M:%S',timeStruct)

获取博客标题：

其实就是从目录字符串中截掉后缀名，再截掉最后一个?/?之前的内容即可得到博客名称：

# 获取目录中去掉前面路径和后缀的文件名字def getFileSimpleName(filePath):

name = ''

# 先去掉后缀

name = os.path.splitext(filePath)[0] ?# 获取最后一个斜杠位置

index = name.rfind('/') ?# 找不到则返回 -1

if index != -1: ?# 截取斜杠后面到结尾内容

name = name[index+1:] ?# print name

return name

获取文件所在的目录名称作为页签值：

与获取博客名称思路略有相似，获取最后一个斜杠位置，截掉斜杠之后的内容，在获取一个最后一个斜杠位置，假如有则截取斜杠之后的内容即是文件所在目录的名称：

# 获得分类文件目录名称def getTypeNameByPath(filePath):fileTag = ''# 获取最后一个斜杠位置index = filePath.rfind('/')# 找不到则返回 -1if index != -1: ? ?# 截取斜杠后面到结尾内容

fileTag = filePath[:index] ? ?# 截掉前面部分

index = fileTag.rfind('/') ? ?if index != -1:

fileTag = fileTag[index+1:]# print fileTagreturn fileTag

向文件中插入内容：

调用以上方法即可分别得到我们想要的信息：

# 指定目录path = './'# 得到文件列表files = getFileList(path,'.md') ?

for i in files: ?print 'title: '+getFileSimpleName((i.decode("string_escape"))) ?print 'date: '+get_FileCreateTime((path+i.decode("string_escape"))) ?print 'tags: ['+getTypeNameByPath((i.decode("string_escape")))+']'

接下来要做的就是把这些内容按照格式插入到文件中去，当然插入之前需要先检查文件中是否已经插入过类似的内容了，可以简单地通过检查开头 40 个字符串中是否包含这个字符串来判别：

'''---

title: '''

关于展示分隔符?!--more--?插入的位置，大致逻辑是：第一个标题后面，而且刚好插入在第二个标题之前即可，而使用 Markdown 语法撰写的博客标题使用?#?来表示的，最终的插入方法如下：

# 向文件中插入指定数据def addHeadToFile(filePath,title,date,tags):file = open(filePath,"r")

content = file.read()

index = content[:40].find('''---

title:''')# 添加if index == -1: ? ?print 'Undadded'

addContent = '''---

title: '''+title+'''

date: '''+date+'''

tags: ['''+tags+''']

categories: '''+tags+'''

hr /

'''

# 检测是否插入部分显示标签

content = addContent + content

index = content.find('''!--more-- ''') ? ?if index == -1: ? ? ? ?# 获取第一段的位置

index = content.find('''### ''') ? ? ? ?if index != -1: ? ? ? ? ? ?#print "first ### pos = ",index

# 下一个标题位置（在第二个标题之前插入即可）

pos = content[index:].find('''

#''',1) ? ? ? ? ? ?if pos != -1:

index += pos ? ? ? ? ? ? ? ?#print "second enter pos = ",index

content = content[:index]+'''

!--more--

'''+content[index:]

file = open(filePath,"w")

file.write(content)else: ? ?#print 'file head had added'# 记得要关闭文件file.close()

最后完整的调用过程：

# 指定目录path = './'# 得到文件列表files = getFileList(path,'.md') ?

# 声明一些全局变量title = ''date = ''tags = ''for i in files:

title = getFileSimpleName(i.decode("string_escape"))

date = get_FileCreateTime(path+i.decode("string_escape"))

tags = getTypeNameByPath(i.decode("string_escape")) ? ?print 'title: '+title ? ?print 'date: '+date ? ?print 'tags: ['+tags+']'

addHeadToFile(path+i.decode("string_escape"),title,date,tags)

python网页操作自动化脚本(python自动化操作浏览器)

appium + python编写自动化脚本

之前一篇博客已经讲述怎样手动使用 appium-desktop启动测试机上的app ，但我们实际跑自动化脚本的过程中，是需要用脚本调用appium启动app的，接下来就尝试写Python脚本启动app并登陆app。环境为Windows10 + Python3.7 + appium1.18.0 + Android手机 + 今日头条app + Pycharm

具体的获取方法请参考 APP自动化测试之appium连接真机启动app ，配置信息如下：

appium在本机开启的话则IP为127.0.0.1，端口默认为4723

我们会看到手机上今日头条app被打开。

我们查看手机，会发现手机正在自动做登录今日头条的app操作，且登录成功。

至此，我们通过编写一个简单的Python脚本完成了登录app的操作，如果加上断言，就是一条完整的用例。

想用python编写一个脚本,登录网页,在网页里做一系列操作,应该怎样实现?

python编写一个脚本的具体操作：

1、首先，打开python并创建一个新的PY文件。

2、其次，import os，因为涉及系统文件的路径，因此首先在此处导入系统模块。

3、随后，可以双击打开HTML文件，然后就可以看到书写的网页，如下图所示。

4、最后，添加html.close()，需添加此行代码以关闭，否则将占用大量内存，如下图所示。这样，用python简单的制作一个网页的所有操作就完成了。完成。

(责任编辑：IT教学网)

复制链接发给好友收藏本文关闭此页

上一篇：饥荒各种小技巧小知识(饥荒小常识)

下一篇：怎样在百度上做广告推广(怎样在百度上做广告推广赚钱)

python网页操作自动化脚本(python自动化操作浏览器)

想要用python3做个软件对网页自动化操作，需要搭建什么环境，如何实现？？？

PYTHON怎样编写自动化

appium + python编写自动化脚本

想用python编写一个脚本,登录网页,在网页里做一系列操作,应该怎样实现?

(责任编辑：IT教学网)

相关java认证文章

阅读排行

专题教程

推荐java认证文章

最新更新java认证