当前位置： > 网页资讯 > 网站经济 > 文章内容

python爬取天气数据绘制柱形图(python爬虫天气)

http://www.itjxue.com 2023-04-04 01:16 来源:未知 点击次数:

Python气象数据处理与绘图(4)：显著性检验

其实在(2)中已经提到了相关系数和回归系数，在计算过程中，直接返回了对应的p-value，因此可以直接使用p-value。

计算两个独立样本得分均值的T检验。

这是对两个独立样本具有相同平均值（预期值）的零假设的双边检验。此测试假设默认情况下总体具有相同的方差。在合成分析中通常用到t-test。

当a,b为变量场时，即[time,lat,lon]时，a,b两个数组的经纬度需相同。

nan_policy 可选{‘propagate’, ‘raise’, ‘omit’}

“propagate”：返回nan

“raise”：报错

“omit”：执行忽略nan值的计算

计算得到的P值用于绘图，当p0.01时，通过99%显著性检验，p0.05，通过95%显著性检验，以此类推。

图形绘制只需在原有填色图上叠加打点图层,实际上打点也是特殊的图色，只不过将颜色换成了点，实际上用到的还是contourf函数。

通过contourf对应参数调节打点图层的细节。

python爬取天气数据绘制柱形图(python爬虫天气)

Python气象数据处理与绘图(2)：常用数据计算方法

对于气象绘图来讲，第一步是对数据的处理，通过各类公式，或者统计方法将原始数据处理为目标数据。

按照气象统计课程的内容，我给出了一些常用到的统计方法的对应函数：

在计算气候态，区域平均时均要使用到求均值函数，对应NCL中的dim_average函数，在python中通常使用np.mean()函数

numpy.mean(a, axis, dtype)

假设a为[time,lat,lon]的数据，那么

需要特别注意的是，气象数据中常有缺测，在NCL中，使用求均值函数会自动略过，而在python中，当任意一数与缺测(np.nan)计算的结果均为np.nan，比如求[1,2,3,4，np.nan]的平均值，结果为np.nan

因此，当数据存在缺测数据时，通常使用np.nanmean()函数，用法同上，此时[1,2,3,4，np.nan]的平均值为(1+2+3+4)/4 = 2.5

同样的，求某数组最大最小值时也有np.nanmax(), np.nanmin()函数来补充np.max(), np.min()的不足。

其他很多np的计算函数也可以通过在前边加‘nan’来使用。

另外，

也可以直接将a中缺失值全部填充为0。

np.std(a, axis, dtype)

用法同np.mean()

在NCL中有直接求数据标准化的函数dim_standardize()

其实也就是一行的事，根据需要指定维度即可。

皮尔逊相关系数：

相关可以说是气象科研中最常用的方法之一了，numpy函数中的np.corrcoef(x, y)就可以实现相关计算。但是在这里我推荐scipy.stats中的函数来计算相关系数：

这个函数缺点和有点都很明显，优点是可以直接返回相关系数R及其P值，这避免了我们进一步计算置信度。而缺点则是该函数只支持两个一维数组的计算，也就是说当我们需要计算一个场和一个序列的相关时，我们需要循环来实现。

其中a[time,lat,lon]，b[time]

(NCL中为regcoef()函数)

同样推荐Scipy库中的stats.linregress(x,y)函数：

slop: 回归斜率

intercept：回归截距

r_value：相关系数

p_value： P值

std_err：估计标准误差

直接可以输出P值，同样省去了做置信度检验的过程，遗憾的是仍需同相关系数一样循环计算。

Python气象数据处理与绘图(12)：轨迹(台风路径，寒潮路径，水汽轨迹)绘制

寒潮是笔者主要的研究方向，寒潮路径作为寒潮重要的特征，是寒潮预报的重点之一，同样的道理也适用在台风研究以及降水的水汽来源研究中。关于路径的计算以及获取方法(比如轨迹倒推，模型追踪等等方法，台风有自己现成的数据集，比如ibtracs数据集等等)并不在本文的介绍范围之内，本文主要介绍在获取了相应的路径坐标后，如何在图中美观的展现。

上图展现了近40年东北亚区域的冬季冷空气活动路径，绘制这类图需要的数据只需为每条路径的N个三维坐标点，第一第二维分别为longitude和latitudee，第三维则比较随意，根据需要选择，比如说需要体现高度，那就用高度坐标，需要体现冷空气强度，那就用温度数据，水汽可以用相对湿度，台风也可以用速度等等。

通常此类数据是由.txt(.csv)等格式存储的，读取和处理方法可参考我的“Python气象数据处理与绘图(1)：数据读取”，本文主要介绍绘图部分。

当然根据需要，也可以直接绘制两维的轨迹，即取消掉颜色数组，用最简单的plot语句，循环绘制即可。

有一个陷阱需要大家注意的是，当轨迹跨越了东西半球时，即穿越了0°或者360°经线时，它的连接方式是反向绕一圈，比如下图所示，你想要蓝色的轨迹，然而很有可能得到绿色的，这是因为你的网格数组的边界是断点，系统不会自动识别最短路径，只会在数组中直接想连，因为这不是循环数组。

我目前的解决办法是这样的：如果你的数据是0°-360°格式，那么变为-180°-180°的格式，反之相互转换。但是如果你的数据两种都出现了断点，也就是绕了地球一圈多，那无论怎样都么得办法了，我目前的思路是将数据转换成极坐标数据格式，理论上是可行的，CARTOPY的绘图也是支持极坐标数据的，具体实施还需要再试试。

Python气象数据处理与绘图(1)：数据读取

python很多库支持了对nc格式文件的读取，比如NetCDF4，PyNio(PyNio和PyNgl可以看做是NCL的Python版本)以及Xarray等等。

我最初使用PyNio，但是由于NCL到Python的移植并不完全，导致目前远不如直接使用NCL方便，而在接触Xarray库后，发现其功能强大远超NCL(也可能是我NCL太菜的原因)。

安装同其它库一致：

我这里以一套中国逐日最高温度格点资料(CN05.1)为例，其水平精度为0.5°X0.5°。

可以看到，文件的坐标有时间，经度，纬度，变量有日最高温

我们将最高温数据取出

这与Linux系统中的ncl_filedump指令看到的信息是类似的

Xarray在读取坐标信息时，自动将时间坐标读取为了datetime64 格式，这对我们挑选目的时间十分方便。Xarray通常与pandas配合使用。

比如我们想选取1979.06.01-1979.06.20时期数据，我们只需

再比如我们想选取夏季数据时，只需

更多的时间操作同python的datetime函数类似。

当我们想选取特定经纬度范围(高度)的数据时，.loc[]函数同样可以解决。

在这里，我选取了40°N-55°N，115°E-135°E范围的数据

甚至，我们还可以套娃，同时叠加时间和范围的选取

这足够满足常用到的数据索引要求。

对于这类简单排列的.txt文件，可以通过np.load读取，用pandas的.read_csv更为方便

读取txt的同时，对每列赋予了一个列名，通过data.a可以直接按列名调用相应数据。

对于较复杂的.txt文件，仍可通过该函数读取

skiprows=5跳过了前5行的文件头，sep='\s+'定义了数据间隔为空格，这里用的是正则表达。

pd.read_csv函数有很多的参数，可以处理各种复杂情况下的文本文件读取。

grib文件可通过pygrib库读取

import pygrib

f = pygrib.open('xxx.grb')

python气象绘图windrose

#导入包

import numpy as np

import pandas as pd

from matplotlib import pyplot as plt

from matplotlib.ticker import FuncFormatter

import matplotlib as mpl

mpl.rcParams['font.sans-serif'] = ['SimHei']? #设置简黑字体

mpl.rcParams['axes.unicode_minus'] = False? #设置负号正常显示

#----获取数据DataFrames，index*columns。index表示不同值范围，columns表示十六个风向

data = pd.DataFrame(wind_d_max_num_per,

? ? ? ? ? ? ? ? ? ? index=['15', '15~25', '25~35', '35~45',"≥45"],

? ? ? ? ? ? ? ? ? ? columns='N NNE NE ENE E ESE SE SSE S SSW SW WSW W WNW NW NNW'.split())

N = 16 # 风速分布为16个方向

theta = np.linspace(0, 2*np.pi, N, endpoint=False) # 获取16个方向的角度值

width = np.pi / 4 * 0.4? # 绘制扇型的宽度，可以自行调整0.5时是360，充满，有间隔的话小于0.5即可

labels = list(data.columns) # 自定义坐标标签为 N ， NSN， ……# 开始绘图

plt.figure(figsize=(6,6),dpi=600)

ax = plt.subplot(111, projection='polar')

#----自定义颜色

mycolor =['cornflowerblue','orange','mediumseagreen','lightcoral','cyan']

#----循环画风玫瑰图

i=0

for idx in data.index:

? ? print(idx)

? ? # 每一行绘制一个扇形

? ? radii = data.loc[idx] # 每一行数据

? ? if i == 0:

? ? ? ? ax.bar(theta, radii, width=width, bottom=0.0, label=idx, tick_label=labels,

? ? ? ? ? color=mycolor[i])

? ? else:

? ? ? ? ax.bar(theta, radii, width=width, bottom=np.sum(data.loc[data.index[0:i]]), label=idx, tick_label=labels,

? ? ? ? ? color=mycolor[i])

? ? i=i+1

#此种画法，注意bottom设置，第一个bottom为0，后续bottom需要在前一个基础上增加。

ax.set_xticks(theta)

ax.set_xticklabels(labels,fontdict={'weight':'bold','size':15,'color':'k'})

ax.set_theta_zero_location('N') #设置零度方向北

ax.set_theta_direction(-1)? ? # 逆时针方向绘图

#----设置y坐标轴以百分数显示

plt.gca().yaxis.set_major_formatter(FuncFormatter(lambda s, position: '{:.0f}%'.format(100*s)))

plt.legend(loc=4, bbox_to_anchor=(0.05, -0.25),fontsize=12) # 将label显示出来，并调整位置

#----保存图片

plt.savefig("./windrose1.svg")

(责任编辑：IT教学网)

复制链接发给好友收藏本文关闭此页

上一篇：文科生学中医可以学什么专业(文科生适合学中医药吗)

下一篇：有道编程和核桃编程哪个好(有道少儿编程和核桃编程哪个好)

python爬取天气数据绘制柱形图(python爬虫天气)

Python气象数据处理与绘图(4)：显著性检验

Python气象数据处理与绘图(2)：常用数据计算方法

Python气象数据处理与绘图(12)：轨迹(台风路径，寒潮路径，水汽轨迹)绘制

Python气象数据处理与绘图(1)：数据读取

python气象绘图windrose

(责任编辑：IT教学网)

相关网站经济文章

阅读排行

专题教程

推荐网站经济文章

最新更新网站经济