pandas数据读取与索引设置
pandas 提供了多种方法来读取不同类型的文件,如 CSV、Excel、JSON、SQL 数据库等。通过 pd.read_csv() 函数可以读取 CSV 文件,pd.read_excel() 函数读取 Excel 文件,pd.read_json() 函数读取 JSON 文件,pd.read_sql() 函数读取 SQL 数据库中的数据。这些函数使得从各种数据源加载数据变得非常方便,支持自定义选项如指定列名、文件编码、数据类型等,大幅简化了数据导入和处理的过程。
df.set_index() 是 pandas 中用于设置 DataFrame 索引的方法。通过该方法,可以将 DataFrame 中的一列或多列设置为索引,从而方便数据的操作和分析。
df.set_index() 的基本语法如下:
df.set_index(keys,drop=True,append=False, inplace=False, verify_integrity=False)
keys: 用于设置为索引的列名或列名列表。
drop: 是否在设置索引后删除该列,默认为 True。
append: 是否将新的索引附加到现有的索引上,默认为 False。
inplace: 是否在原 DataFrame 上进行修改,默认为 False,即返回一个新的 DataFrame。
verify_integrity: 是否检查索引是否有重复值,默认为 False。
df.set_index('年份', inplace=True) 的作用是将 DataFrame 中的‘年份’列设置为索引,并且在原 DataFrame 上进行修改,而不是返回一个新的 DataFrame。



