使用python编程中,如果想读写超过内存的大数据,可以引入 h5py库使用,h5py是Python语言用来操作HDF5的模块,h5py文件是存放两类对象的容器,可以存放大量的数据,本文向大家介绍h5py的核心概念及相关安装步骤。
一、h5py是什么?
1、h5py是Python语言用来操作HDF5的模块。
2、h5py文件是存放两类对象的容器,数据集(dataset)和组(group)。
二、h5py的核心概念
1、文件file,作为一种层次化的数据容器,file可理解为树根;
2、组group,存储的索引,相当于树的节点;
3、数据集dataset,索引对应的存储数据,相当于节点内存储的数据;
4、属性attr,用来存储额外的小块元数据。
三、安装
如果你使用的是Anaconda的话,安装命令如下:
conda install h5py
如果没有,安装命令如下:
pip install h5py
以上就是python中h5py的有关介绍,希望能对你有所帮助哟~