在pandas的日常使用中,經(jīng)常對(duì)數(shù)據(jù)進(jìn)行處理會(huì)導(dǎo)致數(shù)據(jù)索引順序錯(cuò)亂,從而影響數(shù)據(jù)讀取、插入等。今天小編就帶來了幾種pandas如何重置DataFrame索引的方法,喜歡能對(duì)小伙伴們有所幫助。
import pandas as pd
import numpy as np
df = pd.DataFrame(np.arange(20).reshape((5, 4)),columns=['a', 'b', 'c', 'd'])
#得到df:
a b c d
0 0 1 2 3
1 4 5 6 7
2 8 9 10 11
3 12 13 14 15
4 16 17 18 19
# 對(duì)其重排順序,得到索引順序倒序的數(shù)據(jù)
df2 = df.sort_values('a', ascending=False)
# 得到df2:
a b c d
4 16 17 18 19
3 12 13 14 15
2 8 9 10 11
1 4 5 6 7
0 0 1 2 3
下面對(duì)df2重置索引,使其索引從0開始
法一:
簡(jiǎn)單粗暴:
df2.index = range(len(df2))
# 輸出df2:
a b c d
0 16 17 18 19
1 12 13 14 15
2 8 9 10 11
3 4 5 6 7
4 0 1 2 3
法二:
df2 = df2.reset_index(drop=True) # drop=True表示刪除原索引,不然會(huì)在數(shù)據(jù)表格中新生成一列'index'數(shù)據(jù)
# 輸出df2:
a b c d
0 16 17 18 19
1 12 13 14 15
2 8 9 10 11
3 4 5 6 7
4 0 1 2 3
法三:
df2 = df2.reindex(labels=range(len(df)) #labels是第一個(gè)參數(shù),可以省略
# 輸出df2
a b c d
0 16 17 18 19
1 12 13 14 15
2 8 9 10 11
3 4 5 6 7
4 0 1 2 3
# 注:df = df.reindex(index=[]),在原數(shù)據(jù)結(jié)構(gòu)上新建行(index是新索引,若新建數(shù)據(jù)索引在原數(shù)據(jù)中存在,則引用原有數(shù)據(jù)),默認(rèn)用NaN填充(使用fill_value=0 來修改填充值自定義,此處我設(shè)置的是0)。
# df = df.reindex(columns=[]),在原數(shù)據(jù)結(jié)構(gòu)上新建列,方法與新建行一樣
法四:
df2 = df2.set_index(keys=['a', 'c']) # 將原數(shù)據(jù)a, c列的數(shù)據(jù)作為索引。
# drop=True,默認(rèn),是將數(shù)據(jù)作為索引后,在表格中刪除原數(shù)據(jù)
# append=False,默認(rèn),是將新設(shè)置的索引設(shè)置為內(nèi)層索引,原索引是外層索引
# 輸出df2,注意a,c列是索引:
b d
a c
16 18 17 19
12 14 13 15
8 10 9 11
4 6 5 7
0 2 1 3
小結(jié)
到此這篇關(guān)于pandas如何重置dataframe索引的文章就介紹到這了,更多pandas相關(guān)的學(xué)習(xí)內(nèi)容請(qǐng)搜索W3Cschool以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持W3Cschool!