在python中处理的数据量通常会比较大,例如千万级数据,而且我们不能一目了然地了解整个数据表,而且必须通过某种方法获得关于数据表的关键信息。DataTableCheck的另一个用途是了解数据的总体情况,如整个数据表的大小、占用的空间、数据格式、是否有空值、重复项和具体的数据内容。准备好进行后续清洁和预处理。
1、数据维度(行列)
Excel中可以通过CTRL+向下的光标键,和CTRL+向右的光标键来查看行号和列号。Python中使用shape函数来查看数据表的维度,也就是行数和列数,
2、数据表信息
使用info函数在这里可以看到数据表的总体信息,其中包含更多的信息,包括数据维度、列名、数据格式和占用的空间。
3、查看数据格式
Excel中通过选中单元格并查看开始菜单中的数值类型来判断数据的格式。Python中使用dtypes函数来返回数据格式。
Dtypes是一个查看数据格式的函数,可以一次性查看数据表中所有数据的格式,也可以指定一列来单独查看。
以上就是Python数据表进行检查的方法,希望能对大家有所帮助,更多知识尽在python学习网。