NumPy 索引

2021-09-01 09:48 更新

數(shù)組索引是指使用方括號 ([]) 來索引數(shù)組值。索引有很多選項,這賦予了 NumPy 索引強大的功能,但功能帶來了一些復雜性和混亂的可能性。本節(jié)只是對與索引相關(guān)的各種選項和問題的概述。除了單元素索引之外,大多數(shù)這些選項的詳細信息都可以在相關(guān)部分中找到。

1、賦值 vs 引用

以下大多數(shù)示例顯示了在引用數(shù)組中的數(shù)據(jù)時索引的使用。這些示例在分配給數(shù)組時也能正常工作。有關(guān)分配如何工作的具體示例和說明,請參閱最后的部分。

2、單元素索引

一維數(shù)組的單個元素索引是人們所期望的。它的工作方式與其他標準 Python 序列完全一樣。它是基于 0 的,并接受從數(shù)組末尾開始索引的負索引。

>>> x = np.arange(10)
>>> x[2]
2
>>> x[-2]
8

與列表和元組不同,NumPy 數(shù)組支持多維數(shù)組的多維索引。這意味著沒有必要將每個維度的索引分隔到它自己的一組方括號中。

>>> x.shape = (2,5) # now x is 2-dimensional
>>> x[1,3]
8
>>> x[1,-1]
9

請注意,如果索引一個多維數(shù)組的索引少于維數(shù),則會得到一個子維數(shù)組。例如:

>>> x[0]
array([0, 1, 2, 3, 4])

也就是說,指定的每個索引都選擇與所選維度的其余部分相對應(yīng)的數(shù)組。在上面的示例中,選擇 0 意味著長度為 5 的剩余維度未指定,并且返回的是該維度和大小的數(shù)組。必須注意,返回的數(shù)組不是原始數(shù)組的副本,而是指向與原始數(shù)組相同的內(nèi)存中的值。在這種情況下,返回第一個位置 (0) 的一維數(shù)組。因此,在返回的數(shù)組上使用單個索引會導致返回單個元素。那是:

>>> x[0][2]
2

所以請注意,盡管第二種情況效率更低,因為在第一個索引之后創(chuàng)建了一個新的臨時數(shù)組,該索引隨后被 2 索引。x[0,2]?=?x[0][2]

請注意那些習慣于 IDL 或 Fortran 內(nèi)存順序的人,因為它與索引有關(guān)。NumPy 使用 C 順序索引。這意味著最后一個索引通常代表變化最快的內(nèi)存位置,與 Fortran 或 IDL 不同,第一個索引代表內(nèi)存中變化最快的位置。這種差異代表了很大的混淆可能性。

3、其他索引選項

可以對數(shù)組進行切片和跨步以提取維數(shù)相同但大小與原始數(shù)組不同的數(shù)組。切片和跨步的工作方式與列表和元組的工作方式完全相同,只是它們也可以應(yīng)用于多個維度。幾個例子最能說明問題:

>>> x = np.arange(10)
>>> x[2:5]
array([2, 3, 4])
>>> x[:-7]
array([0, 1, 2])
>>> x[1:7:2]
array([1, 3, 5])
>>> y = np.arange(35).reshape(5,7)
>>> y[1:5:2,::3]
array([[ 7, 10, 13],
       [21, 24, 27]])

請注意,數(shù)組切片不會復制內(nèi)部數(shù)組數(shù)據(jù),而只會生成原始數(shù)據(jù)的新視圖。這與列表或元組切片不同,copy()如果不再需要原始數(shù)據(jù),建議使用顯式切片。

為了從數(shù)組中選擇值列表到新數(shù)組中,可以用其他數(shù)組索引數(shù)組。有兩種不同的方法可以實現(xiàn)這一點。一種使用一個或多個索引值數(shù)組。另一個涉及提供適當形狀的布爾數(shù)組來指示要選擇的值。索引數(shù)組是一種非常強大的工具,可以避免遍歷數(shù)組中的單個元素,從而大大提高性能。

可以使用特殊功能通過索引有效地增加數(shù)組中的維數(shù),以便生成的數(shù)組獲得在表達式或特定函數(shù)中使用所需的形狀。

4、索引數(shù)組

NumPy 數(shù)組可以與其他數(shù)組(或任何其他可以轉(zhuǎn)換為數(shù)組的類似序列的對象,例如列表,元組除外;有關(guān)原因,請參閱本文檔末尾)進行索引。索引數(shù)組的使用范圍從簡單、直接的情況到復雜、難以理解的情況。對于索引數(shù)組的所有情況,返回的是原始數(shù)據(jù)的副本,而不是切片的視圖。

索引數(shù)組必須是整數(shù)類型。數(shù)組中的每個值指示使用數(shù)組中的哪個值來代替索引。為了顯示:

>>> x = np.arange(10,1,-1)
>>> x
array([10,  9,  8,  7,  6,  5,  4,  3,  2])
>>> x[np.array([3, 3, 1, 8])]
array([7, 7, 9, 2])

由值 3、3、1 和 8 組成的索引數(shù)組相應(yīng)地創(chuàng)建了一個長度為 4 的數(shù)組(與索引數(shù)組相同),其中每個索引都被索引數(shù)組在被索引的數(shù)組中具有的值替換。

負值是允許的,并且可以像處理單個索引或切片一樣工作:

>>> x[np.array([3,3,-3,8])]
array([7, 7, 4, 2])

索引值越界是錯誤的:

>>> x[np.array([3, 3, 20, 8])]
<type 'exceptions.IndexError'>: index 20 out of bounds 0<=index<9

一般而言,使用索引數(shù)組時返回的是一個與索引數(shù)組形狀相同的數(shù)組,但被索引的數(shù)組的類型和值。例如,我們可以改用多維索引數(shù)組:

>>> x[np.array([[1,1],[2,3]])]
array([[9, 9],
       [8, 7]])

5、索引多維數(shù)組

當多維數(shù)組被索引時,事情變得更加復雜,尤其是多維索引數(shù)組。這些往往是更不尋常的用途,但它們是允許的,并且它們對某些問題很有用。我們將從最簡單的多維情況開始(使用前面示例中的數(shù)組 y):

>>> y[np.array([0,2,4]), np.array([0,1,2])]
array([ 0, 15, 30])

在這種情況下,如果索引數(shù)組具有匹配的形狀,并且被索引的數(shù)組的每個維度都有一個索引數(shù)組,則結(jié)果數(shù)組與索引數(shù)組具有相同的形狀,并且值對應(yīng)于為每個維度設(shè)置的索引在索引數(shù)組中的位置。在此示例中,兩個索引數(shù)組的第一個索引值都是 0,因此結(jié)果數(shù)組的第一個值是 y[0,0]。下一個值是 y[2,1],最后一個值是 y[4,2]。

如果索引數(shù)組的形狀不同,則會嘗試將它們廣播為相同的形狀。如果它們不能廣播到相同的形狀,則會引發(fā)異常:

>>> y[np.array([0,2,4]), np.array([0,1])]
<type 'exceptions.ValueError'>: shape mismatch: objects cannot be
broadcast to a single shape

廣播機制允許索引數(shù)組與其他索引的標量組合。效果是標量值用于索引數(shù)組的所有對應(yīng)值:

>>> y[np.array([0,2,4]), 1]
array([ 1, 15, 29])

跳到下一個復雜級別,可以僅部分索引具有索引數(shù)組的數(shù)組。理解在這種情況下會發(fā)生什么需要一些思考。例如,如果我們只使用一個帶有 y 的索引數(shù)組:

>>> y[np.array([0,2,4])]
array([[ 0,  1,  2,  3,  4,  5,  6],
       [14, 15, 16, 17, 18, 19, 20],
       [28, 29, 30, 31, 32, 33, 34]])

結(jié)果是構(gòu)建一個新數(shù)組,其中索引數(shù)組的每個值從被索引的數(shù)組中選擇一行,結(jié)果數(shù)組具有結(jié)果形狀(索引元素的數(shù)量,行的大小)。 這可能有用的一個例子是顏色查找表,我們希望將圖像的值映射到 RGB 三元組以進行顯示。查找表可以有一個形狀 (nlookup, 3)。用 dtype=np.uint8(或任何整數(shù)類型,只要值在查找表的范圍內(nèi))形狀為 (ny, nx) 的圖像索引這樣的數(shù)組將導致形狀為 (ny, nx, 3) 其中三個 RGB 值與每個像素位置相關(guān)聯(lián)。 通常,結(jié)果數(shù)組的形狀將是索引數(shù)組的形狀(或所有索引數(shù)組被廣播到的形狀)與被索引的數(shù)組中任何未使用的維度(未索引的維度)的形狀的串聯(lián).

6、布爾或“掩碼”索引數(shù)組

用作索引的布爾數(shù)組的處理方式與索引數(shù)組完全不同。布爾數(shù)組的形狀必須與被索引的數(shù)組的初始維度相同。在最直接的情況下,布爾數(shù)組具有相同的形狀:

>>> b = y>20
>>> y[b]
array([21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34])

與整數(shù)索引數(shù)組的情況不同,在布爾情況下,結(jié)果是一個一維數(shù)組,其中包含索引數(shù)組中與布爾數(shù)組中所有真實元素相對應(yīng)的所有元素。索引數(shù)組中的元素總是以行優(yōu)先(C 樣式)順序迭代和返回?。結(jié)果也與 相同?y[np.nonzero(b)]。與索引數(shù)組一樣,返回的是數(shù)據(jù)的副本,而不是切片時的視圖。

如果 y 的維度多于 b,結(jié)果將是多維的。例如:

>>> b[:,5] # use a 1-D boolean whose first dim agrees with the first dim of y
array([False, False, False,  True,  True])
>>> y[b[:,5]]
array([[21, 22, 23, 24, 25, 26, 27],
       [28, 29, 30, 31, 32, 33, 34]])

這里從索引數(shù)組中選擇第 4 行和第 5 行并組合成一個二維數(shù)組。

一般來說,當布爾數(shù)組的維數(shù)比被索引的數(shù)組少時,這相當于 y[b, …],這意味著 y 由 b 索引,后跟盡可能多的 : 以填充 y 的秩。因此,結(jié)果的形狀是一維,包含布爾數(shù)組的 True 元素的數(shù)量,然后是被索引的數(shù)組的其余維度。

例如,使用具有四個 True 元素的形狀 (2,3) 的二維布爾數(shù)組從形狀 (2,3,5) 的 3-D 數(shù)組中選擇行會導致形狀 (4 ,5):

>>> x = np.arange(30).reshape(2,3,5)
>>> x
array([[[ 0,  1,  2,  3,  4],
        [ 5,  6,  7,  8,  9],
        [10, 11, 12, 13, 14]],
       [[15, 16, 17, 18, 19],
        [20, 21, 22, 23, 24],
        [25, 26, 27, 28, 29]]])
>>> b = np.array([[True, True, False], [False, True, True]])
>>> x[b]
array([[ 0,  1,  2,  3,  4],
       [ 5,  6,  7,  8,  9],
       [20, 21, 22, 23, 24],
       [25, 26, 27, 28, 29]])

有關(guān)更多詳細信息,請參閱有關(guān)數(shù)組索引的 NumPy 參考文檔。

7、將索引數(shù)組與切片結(jié)合

索引數(shù)組可以與切片組合。例如:

>>> y[np.array([0, 2, 4]), 1:3]
array([[ 1,  2],
       [15, 16],
       [29, 30]])

實際上,切片和索引數(shù)組操作是獨立的。切片操作提取索引為 1 和 2 的列(即第 2 和第 3 列),然后是索引數(shù)組操作提取索引為 0、2 和 4 的行(即第一、第三和第五行)。

這相當于:

>>> y[:, 1:3][np.array([0, 2, 4]), :]
array([[ 1,  2],
       [15, 16],
       [29, 30]])

同樣,切片可以與廣播布爾索引結(jié)合使用:

>>> b = y > 20
>>> b
array([[False, False, False, False, False, False, False],
      [False, False, False, False, False, False, False],
      [False, False, False, False, False, False, False],
      [ True,  True,  True,  True,  True,  True,  True],
      [ True,  True,  True,  True,  True,  True,  True]])
>>> y[b[:,5],1:3]
array([[22, 23],
       [29, 30]])

8、結(jié)構(gòu)索引工具

為了便于數(shù)組形狀與表達式和賦值的匹配,可以在數(shù)組索引中使用 np.newaxis 對象來添加大小為 1 的新維度。例如:

>>> y.shape
(5, 7)
>>> y[:,np.newaxis,:].shape
(5, 1, 7)

請注意,數(shù)組中沒有新元素,只是維度增加了。這可以方便地以一種方式組合兩個數(shù)組,否則將需要顯式重塑操作。例如:

>>> x = np.arange(5)
>>> x[:,np.newaxis] + x[np.newaxis,:]
array([[0, 1, 2, 3, 4],
       [1, 2, 3, 4, 5],
       [2, 3, 4, 5, 6],
       [3, 4, 5, 6, 7],
       [4, 5, 6, 7, 8]])

省略號語法可用于指示完全選擇任何剩余的未指定維度。例如:

>>> z = np.arange(81).reshape(3,3,3,3)
>>> z[1,...,2]
array([[29, 32, 35],
       [38, 41, 44],
       [47, 50, 53]])

這相當于:

>>> z[1,:,:,2]
array([[29, 32, 35],
       [38, 41, 44],
       [47, 50, 53]])

9、為索引數(shù)組賦值

如前所述,可以使用單個索引、切片以及索引和掩碼數(shù)組來選擇要分配給的數(shù)組子集。分配給索引數(shù)組的值必須形狀一致(與索引生成的形狀相同或可廣播)。例如,允許為切片分配一個常量:

>>> x = np.arange(10)
>>> x[2:7] = 1

或正確大小的數(shù)組:

>>> x[2:7] = np.arange(5)

請注意,如果將較高類型分配給較低類型(如浮點數(shù)為整數(shù))甚至異常(將復雜數(shù)分配為浮點數(shù)或整數(shù)),則賦值可能會導致更改:

>>> x[1] = 1.2
>>> x[1]
1
>>> x[1] = 1.2j
TypeError: can't convert complex to int

與某些引用(例如數(shù)組和掩碼索引)不同,總是對數(shù)組中的原始數(shù)據(jù)進行賦值(實際上,其他任何事情都沒有意義?。?。但請注意,某些操作可能不會像人們天真地預(yù)期的那樣起作用。這個特殊的例子常常讓人們感到驚訝:

>>> x = np.arange(0, 50, 10)
>>> x
array([ 0, 10, 20, 30, 40])
>>> x[np.array([1, 1, 3, 1])] += 1
>>> x
array([ 0, 11, 20, 31, 40])

人們期望第一個位置會增加 3。實際上,它只會增加 1。原因是因為從原始數(shù)組中提取了一個新數(shù)組(作為臨時數(shù)組),其中包含 1、1、3 處的值, 1,然后將值 1 添加到臨時數(shù)組,然后將臨時數(shù)組分配回原始數(shù)組。因此,數(shù)組在 x[1]+1 處的值被分配給 x[1] 3 次,而不是增加 3 次。

10、處理程序中可變數(shù)量的索引

索引語法非常強大,但在處理可變數(shù)量的索引時會受到限制。例如,如果您想編寫一個函數(shù),該函數(shù)可以處理具有各種維數(shù)的參數(shù),而不必為每個可能的維數(shù)編寫特殊的案例代碼,那該怎么做呢?如果向索引提供一個元組,則該元組將被解釋為索引列表。例如(使用數(shù)組 z 的先前定義):

>>> indices = (1,1,1,1)
>>> z[indices]
40

因此,可以使用代碼構(gòu)造任意數(shù)量索引的元組,然后在索引中使用這些元組。 可以使用 Python 中的 slice() 函數(shù)在程序中指定切片。例如:

>>> indices = (1,1,1,slice(0,2)) # same as [1,1,1,0:2]
>>> z[indices]
array([39, 40])

同樣,可以使用 Ellipsis 對象通過代碼指定省略號:

>>> indices = (1, Ellipsis, 1) # same as [1,...,1]
>>> z[indices]
array([[28, 31, 34],
       [37, 40, 43],
       [46, 49, 52]])

出于這個原因,可以直接使用 np.nonzero() 函數(shù)的輸出作為索引,因為它總是返回索引數(shù)組的元組。

由于元組的特殊處理,它們不會像列表那樣自動轉(zhuǎn)換為數(shù)組。舉個例子:

>>> z[[1,1,1,1]] # produces a large array
array([[[[27, 28, 29],
         [30, 31, 32], ...
>>> z[(1,1,1,1)] # returns a single value
40
以上內(nèi)容是否對您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號
微信公眾號

編程獅公眾號