扫二维码与项目经理沟通
我们在微信上24小时期待你的声音
解答本文疑问/技术咨询/运营咨询/技术建议/互联网交流
使用python netCDF4库读取.nc文件 和 创建.nc文件
创新互联专业为企业提供杭锦后网站建设、杭锦后做网站、杭锦后网站设计、杭锦后网站制作等企业网站建设、网页设计与制作、杭锦后企业网站模板建站服务,十年杭锦后做网站经验,不只是建网站,更提供有价值的思路和整体网络服务。
1. 介绍
.nc(network Common Data Format)文件是气象上常用的数据格式,python上读取.nc使用较多的库为netCDF4这个库,下面将介绍这个库的具体方法。
安装很简单:
pip install netCDF4
2. .nc文件的读取
#导入nc库
import netCDF4 as nc
filename = '2017-06-15_2017-06-17.nc' # .nc文件名
f = nc.Dataset(filename) #读取.nc文件,传入f中。此时f包含了该.nc文件的全部信息
#step1: 查看.nc文件的全部变量,及该变量的全部信息(维度大小,单位等)
all_vars = f.variables.keys() #获取所有变量名称
print(len(all_vars)) #长度为18
all_vars_info = f.variables.items() #获取所有变量信息
print(type(all_vars_info)) #输出为: odict_items 。这里将其转化为 list列表
print(len(all_vars_info)) #长度为18
all_vars_info = list(all_vars_info) #此时每个变量的信息为其中一个列表
如图:包含经纬度、时间、等变量名称
看看 all_vars_info的前两个变量的信息,如下,显示了 shape unit name float32 fillvalue等信息
#step2: 查看.nc文件的单个变量,及该变量的全部信息(维度大小,单位等)
如果对某个变量感兴趣(已知变量名),想查看这个变量的信息,获取这个变量的数据,方法如下:
#我们要查看 ’u‘的信息
var = 'u'
var_info = f.variables[var] #获取变量信息
var_data = f[var][:] #获取变量的数据
print(var_info)
print(var_data.shape)
#很方便转化为array数组
print(type(var_data)) # .nc文件的变量数组都为Masked array
var_data = np.array(var_data) #转化为np.array数组
输出如下:
#step3: 列表形式记录所有变量信息
###最直接的办法,获取每个变量的缩写名字,标准名字(long_name),units和shape大小。这样很方便后续操作
all_vars_name = []
all_vars_long_name = []
all_vars_units = []
all_vars_shape = []
for key in f1.variables.keys():
all_vars_name.append(key)
all_vars_long_name.append(f1.variables[key].long_name)
all_vars_units.append(f1.variables[key].units)
all_vars_shape.append(f1.variables[key].shape)
结果如下:
**注意:**完成上述操作之后,记得关掉该文件
f.close() #关闭文件。如果文件关闭后,再使用f.variabels.items()等操作是行不通的。
3. nc文件的创建
#step1: 创建一个文件
f_w = nc.Dataset('hecheng.nc','w',format = 'NETCDF4') #创建一个格式为.nc的,名字为 ‘hecheng.nc’的文件
#step2: 写入一些基本的信息
.nc文件的里面的每个变量都有维度信息,比如,上面的 var=‘u’,维度为 1237161*177。这里面的各个维度,并不是随便定义的,是与基础的变量信息相关的。
如[12,37,161,177] = [time,level,latitude,longitude],第一个维度为时间信息,依次为 垂直层信息,纬度、经度信息。
所以,我们要先写入一些基本的信息:时间,垂直层,纬度,经度
#time纬度为12。注意,第2个参数 表示维度,但是必须是 integer整型,也就是只能创建一个基础单一维度信息。
#如果后面要创建一个变量维度>1,则必须由前面的单一维度组合而来。后面会介绍。
#确定基础变量的维度信息。相对与坐标系的各个轴(x,y,z)
f_w.createDimension('time',12)
f_w.createDimension('level',37)
f_w.createDimension('lat',161)
f_w.createDimension('lon',177)
##创建变量。参数依次为:‘变量名称’,‘数据类型’,‘基础维度信息’
f_w.createVariable('time',np.int,('time'))
f_w.createVariable('level',np.int,('level'))
f_w.createVariable('lat',np.float32,('lat'))
f_w.createVariable('lon',np.float32,('lon'))
#写入变量time的数据。维度必须与定义的一致。
time = np.array([0,6,12,18,0,6,12,18,0,6,12,18])
f_w.variables['time'][:] = time
#新创建一个多维度变量,并写入数据,
f_w.createVariable( 'u', np.float32, ('time','level','lat','lon'))
var_data = np.ones(shape=(12,37,161,177), dtype = np.float32)
f_w.variables[var][:] = var_data
关闭文件
f_w.close()
还可以写入fill_value等信息
按照上述方式创建完成后,用一些可视化软件打开,结果如上图。
#step3: 创建群组
如上图,所以变量都是平行的位置,如果变量特别多,将相同类型的变量放进同一个group中,会更加方便。
来看一个示例: 无锡妇科医院排行 http://www.0510bhyy.com/
f_w = nc.Dataset('haha4.nc','w',format = 'NETCDF4')
f_w.createDimension('time',12)
f_w.createDimension('level',37)
f_w.createDimension('lat',161)
f_w.createDimension('lon',177)
f_w.createVariable('time',np.int,('time'))
f_w.createVariable('level',np.int,('level'))
f_w.createVariable('lat',np.float32,('lat'))
f_w.createVariable('lon',np.float32,('lon'))
time = np.array([0,6,12,18,0,6,12,18,0,6,12,18])
f_w.variables['time'][:] = time
f_w.variables['level'][:] = level
f_w.createVariable( 'q', np.float32, ('time','level','lat','lon'))
var_data = np.ones(shape=(12,37,161,177), dtype = np.float32)
f_w.variables['q'][:] = var_data
#创建一个群组,名字为'wind'
group1 = f_w.createGroup('wind')
group1.createVariable( 'u', np.float32, ('time','level','lat','lon'))
var_data = np.ones(shape=(12,37,161,177), dtype = np.float32)
group1.variables['u'][:] = var_data
group1.createVariable( 'v', np.float32, ('time','level','lat','lon'))
var_data = np.zeros(shape=(12,37,161,177), dtype = np.float32)
group1.variables['v'][:] = var_data
group1.close # 关闭群组, 注意,这里没有括号
f_w.close()
创建结果如下:
看,group的信息出来了
**#step4:查看带有group的.nc文件的信息 **
f1 = nc.Dataset('haha5.nc')
vars = f1.variables.keys() #odict_keys(['time', 'level', 'lat', 'lon', 'q']) 看不到groups信息
#通过以下命令
group_name = f1.groups.keys() #获取组名,输出为:odict_keys(['wind'])
使用如下命令都能看到group内的变量的信息。
#获取group内的变量的数据
group_var_data = f1['wind']['u'][:]
print(group_var_data.shape) #(12, 37, 161, 177)
4. 总结
气象上常用除了.nc文件外,还有 hdf文件,这两者格式都差不多,但是我更爱.hdf格式文件
我们在微信上24小时期待你的声音
解答本文疑问/技术咨询/运营咨询/技术建议/互联网交流