python获取网页json数据(python爬取网页json数据)

http://www.itjxue.com  2023-03-30 01:12  来源:未知  点击次数: 

Python爬虫(七)数据处理方法之JSON

JSON 指的是 JavaScript 对象表示法(JavaScript Object Notation),是轻量级的文本数据交换格式,且具有自我描述性,更易理解。

JSON看起来像python类型(列表,字典)的字符串。

在之前的文章中,我们说到了怎么用response的方法,获取到网页正确解码后的字符串。如果还有不懂的,可以先阅读 Python爬虫(三)Requests库 。接下来以有道翻译为例子,说说怎么通过网页解码后的字符串,提取到翻译结果。

再结合上述有道翻译的例子,得到字典类型的返回结果,并提取出来翻译结果。

将上述例子的dict_json换成str字符串,再写入文本中。

执行完上述的程序,会得到一个fanyi.txt的文件,其结果如下:{"type": "ZH_CN2EN", "errorCode": 0, "elapsedTime": 1, "translateResult": [[{"src": "\u4eba\u751f\u82e6\u77ed\uff0c\u6211\u7528python", "tgt": "Life is too short, I use python"}]]}。这样子的一份文档,中文部分显示的是二进制,且格式非常不利于阅读,这并不是我们想要的结果。好在json.dumps()为我们提供的两个方法,以帮助我们更好阅读文档。

1.ensure_ascii,能够让中文显示成中文;

2.indent,能够让下一行在第一行的基础上空格。

其用法如下:

Python网络请求和解析json数据

Python 的 json 模块提供了两个函数 json.dumps() 和 json.loads() 来编码和解码JSON数据。

如果要处理的是文件而不是字符串,可以使用 json.dump() 和 json.load() 来编码和解码JSON数据。例如:

如何用Python,查找json格式中指定的数据,然后输出这些查找到的数据?

用Python查找json格式中指定的数据输出这些查找到的数据的操作步骤如下:

1,打开一个编辑器,例如sublime text 3,然后创建一个新的PY文档。

2,导入os因为要传输文件,所以我们必须引入os库,以便您可以找到文件。

3,用打开(“ E:\\ test.txt”)作为文件:print(file.readlines())在这里读取文件,可以看到每一行都以列表的形式存储。

4,r l行:l = l.strip(“ \ n”)print(l)在这里,我们使用strip删除换行符。

5,string = l.split(“ =”)接下来,我们使用split将字符串拆分为一个列表。

6,创建一个空字典。结果[string [0]] = string [1]现在将每行的键和值导入字典。

(责任编辑:IT教学网)

更多

推荐Discuz!建站文章