
分析问题所用的数据都是保存在数据文件中的,首先就要从数据文件读取数据。
1、数据文件的格式很多,最常用的是 .csv,.xls 和 .txt 文件,以及 sql 数据库文件的读取。
2、使用pandas 从数据文件导入数据的程序最为简单。
不同格式的使用案例
(1)读取 .csv 文件:
1 2 | df = pd.read_csv( "./example.csv" , engine= "python" , encoding= "utf_8_sig" )
# engine="python"允许处理中文路径,encoding="utf_8_sig"允许读取中文数据
|
(2)读取 .xls 文件:
1 2 | df = pd.read_excel( "./example.xls" , sheetname= 'Sheet1' , header=0, encoding= "utf_8_sig" )
# sheetname 表示读取的sheet,header=0 表示首行为标题行, encoding 表示编码方式
|
(3)读取 .txt 文件:
1 2 | df = pd.read_table( "./example.txt" , sep= "\t" , header=None)
# sep 表示分隔符,header=None表示无标题行,第一行是数据
|
以上就是python读取不同格式文件的方法,希望对大家有所帮助。更多Python学习指路:python基础教程
推荐操作环境:windows7系统、Python 3.9.1,DELL G3电脑。