C++二分查找插入點

2023-09-20 09:20 更新

圖 10-4   二分查找插入點示例數(shù)據(jù)二分查找不僅可用于搜索目標元素,還具有許多變種問題,比如搜索目標元素的插入位置。

10.2.1   無重復元素的情況

Question

給定一個長度為 n 的有序數(shù)組 ?nums? 和一個元素 ?target? ,數(shù)組不存在重復元素。現(xiàn)將 ?target? 插入到數(shù)組 ?nums? 中,并保持其有序性。若數(shù)組中已存在元素 ?target? ,則插入到其左方。請返回插入后 ?target? 在數(shù)組中的索引。

二分查找插入點示例數(shù)據(jù)

圖 10-4   二分查找插入點示例數(shù)據(jù)

如果想要復用上節(jié)的二分查找代碼,則需要回答以下兩個問題。

問題一:當數(shù)組中包含 target 時,插入點的索引是否是該元素的索引?

題目要求將 target 插入到相等元素的左邊,這意味著新插入的 target 替換原來 target 的位置。也就是說,當數(shù)組包含 target 時,插入點的索引就是該 target 的索引。

問題二:當數(shù)組中不存在 target 時,插入點是哪個元素的索引?

進一步思考二分查找過程:當 nums[m] < target 時 i 移動,這意味著指針 i 在向大于等于 target 的元素靠近。同理,指針 j 始終在向小于等于 target 的元素靠近。

因此二分結束時一定有:i 指向首個大于 target 的元素,j 指向首個小于 target 的元素。易得當數(shù)組不包含 target 時,插入索引為 i 。

binary_search_insertion.cpp

/* 二分查找插入點(無重復元素) */
int binarySearchInsertionSimple(vector<int> &nums, int target) {
    int i = 0, j = nums.size() - 1; // 初始化雙閉區(qū)間 [0, n-1]
    while (i <= j) {
        int m = i + (j - i) / 2; // 計算中點索引 m
        if (nums[m] < target) {
            i = m + 1; // target 在區(qū)間 [m+1, j] 中
        } else if (nums[m] > target) {
            j = m - 1; // target 在區(qū)間 [i, m-1] 中
        } else {
            return m; // 找到 target ,返回插入點 m
        }
    }
    // 未找到 target ,返回插入點 i
    return i;
}

存在重復元素的情況

Question

在上一題的基礎上,規(guī)定數(shù)組可能包含重復元素,其余不變。

假設數(shù)組中存在多個 target ,則普通二分查找只能返回其中一個 target 的索引,而無法確定該元素的左邊和右邊還有多少 target。

題目要求將目標元素插入到最左邊,所以我們需要查找數(shù)組中最左一個 target 的索引。初步考慮通過圖 10-5 所示的步驟實現(xiàn)。

  1. 執(zhí)行二分查找,得到任意一個 target 的索引,記為 k 。
  2. 從索引 k 開始,向左進行線性遍歷,當找到最左邊的 target 時返回。

線性查找重復元素的插入點

圖 10-5   線性查找重復元素的插入點

此方法雖然可用,但其包含線性查找,因此時間復雜度為 O(n) 。當數(shù)組中存在很多重復的 target 時,該方法效率很低。

現(xiàn)考慮拓展二分查找代碼。如圖 10-6 所示,整體流程保持不變,每輪先計算中點索引 m ,再判斷 target 和 nums[m] 大小關系,分為以下幾種情況。

  • 當 nums[m] < target 或 nums[m] > target 時,說明還沒有找到 target ,因此采用普通二分查找的縮小區(qū)間操作,從而使指針 i 和 j 向 target 靠近
  • 當 nums[m] == target 時,說明小于 target 的元素在區(qū)間 [i,m?1] 中,因此采用 j=m?1 來縮小區(qū)間,從而使指針 j 向小于 target 的元素靠近。

循環(huán)完成后,i 指向最左邊的 target ,j 指向首個小于 target 的元素,因此索引 i 就是插入點。

二分查找重復元素的插入點的步驟

binary_search_insertion_step2

binary_search_insertion_step3

binary_search_insertion_step4

binary_search_insertion_step5

binary_search_insertion_step6

binary_search_insertion_step7

binary_search_insertion_step8

圖 10-6   二分查找重復元素的插入點的步驟

觀察以下代碼,判斷分支 nums[m] > target 和 nums[m] == target 的操作相同,因此兩者可以合并。

即便如此,我們仍然可以將判斷條件保持展開,因為其邏輯更加清晰、可讀性更好。

binary_search_insertion.cpp

/* 二分查找插入點(存在重復元素) */
int binarySearchInsertion(vector<int> &nums, int target) {
    int i = 0, j = nums.size() - 1; // 初始化雙閉區(qū)間 [0, n-1]
    while (i <= j) {
        int m = i + (j - i) / 2; // 計算中點索引 m
        if (nums[m] < target) {
            i = m + 1; // target 在區(qū)間 [m+1, j] 中
        } else if (nums[m] > target) {
            j = m - 1; // target 在區(qū)間 [i, m-1] 中
        } else {
            j = m - 1; // 首個小于 target 的元素在區(qū)間 [i, m-1] 中
        }
    }
    // 返回插入點 i
    return i;
}

Tip

本節(jié)的代碼都是“雙閉區(qū)間”寫法。有興趣的讀者可以自行實現(xiàn)“左閉右開”寫法。

總的來看,二分查找無非就是給指針 i 和 j分別設定搜索目標,目標可能是一個具體的元素(例如 target ),也可能是一個元素范圍(例如小于 target 的元素)。

在不斷的循環(huán)二分中,指針 i 和 j 都逐漸逼近預先設定的目標。最終,它們或是成功找到答案,或是越過邊界后停止。


以上內容是否對您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號
微信公眾號

編程獅公眾號