閱讀(737) 書簽贊(0) 我要糾錯

C++二分查找插入點

2023-09-20 09:20 更新

圖 10-4 二分查找插入點示例數(shù)據(jù)二分查找不僅可用于搜索目標元素，還具有許多變種問題，比如搜索目標元素的插入位置。

10.2.1 無重復元素的情況

Question

給定一個長度為 n 的有序數(shù)組 ?nums? 和一個元素 ?target? ，數(shù)組不存在重復元素。現(xiàn)將 ?target? 插入到數(shù)組 ?nums? 中，并保持其有序性。若數(shù)組中已存在元素 ?target? ，則插入到其左方。請返回插入后 ?target? 在數(shù)組中的索引。

二分查找插入點示例數(shù)據(jù)

圖 10-4 二分查找插入點示例數(shù)據(jù)

如果想要復用上節(jié)的二分查找代碼，則需要回答以下兩個問題。

問題一：當數(shù)組中包含 target 時，插入點的索引是否是該元素的索引？

題目要求將 target 插入到相等元素的左邊，這意味著新插入的 target 替換原來 target 的位置。也就是說，當數(shù)組包含 target 時，插入點的索引就是該 target 的索引。

問題二：當數(shù)組中不存在 target 時，插入點是哪個元素的索引？

進一步思考二分查找過程：當 nums[m] < target 時 i 移動，這意味著指針 i 在向大于等于 target 的元素靠近。同理，指針 j 始終在向小于等于 target 的元素靠近。

因此二分結束時一定有：i 指向首個大于 target 的元素，j 指向首個小于 target 的元素。易得當數(shù)組不包含 target 時，插入索引為 i 。

binary_search_insertion.cpp

/* 二分查找插入點（無重復元素） */
int binarySearchInsertionSimple(vector<int> &nums, int target) {
    int i = 0, j = nums.size() - 1; // 初始化雙閉區(qū)間 [0, n-1]
    while (i <= j) {
        int m = i + (j - i) / 2; // 計算中點索引 m
        if (nums[m] < target) {
            i = m + 1; // target 在區(qū)間 [m+1, j] 中
        } else if (nums[m] > target) {
            j = m - 1; // target 在區(qū)間 [i, m-1] 中
        } else {
            return m; // 找到 target ，返回插入點 m
        }
    }
    // 未找到 target ，返回插入點 i
    return i;
}

存在重復元素的情況

Question

在上一題的基礎上，規(guī)定數(shù)組可能包含重復元素，其余不變。

假設數(shù)組中存在多個 target ，則普通二分查找只能返回其中一個 target 的索引，而無法確定該元素的左邊和右邊還有多少 target。

題目要求將目標元素插入到最左邊，所以我們需要查找數(shù)組中最左一個 target 的索引。初步考慮通過圖 10-5 所示的步驟實現(xiàn)。

執(zhí)行二分查找，得到任意一個 target 的索引，記為 k 。
從索引 k 開始，向左進行線性遍歷，當找到最左邊的 target 時返回。

線性查找重復元素的插入點

圖 10-5 線性查找重復元素的插入點

此方法雖然可用，但其包含線性查找，因此時間復雜度為 O(n) 。當數(shù)組中存在很多重復的 target 時，該方法效率很低。

現(xiàn)考慮拓展二分查找代碼。如圖 10-6 所示，整體流程保持不變，每輪先計算中點索引 m ，再判斷 target 和 nums[m] 大小關系，分為以下幾種情況。

當 nums[m] < target 或 nums[m] > target 時，說明還沒有找到 target ，因此采用普通二分查找的縮小區(qū)間操作，從而使指針 i 和 j 向 target 靠近。
當 nums[m] == target 時，說明小于 target 的元素在區(qū)間 [i,m?1] 中，因此采用 j=m?1 來縮小區(qū)間，從而使指針 j 向小于 target 的元素靠近。

循環(huán)完成后，i 指向最左邊的 target ，j 指向首個小于 target 的元素，因此索引 i 就是插入點。

二分查找重復元素的插入點的步驟

binary_search_insertion_step2

binary_search_insertion_step3

binary_search_insertion_step4

binary_search_insertion_step5

binary_search_insertion_step6

binary_search_insertion_step7

binary_search_insertion_step8

圖 10-6 二分查找重復元素的插入點的步驟

觀察以下代碼，判斷分支 nums[m] > target 和 nums[m] == target 的操作相同，因此兩者可以合并。

即便如此，我們仍然可以將判斷條件保持展開，因為其邏輯更加清晰、可讀性更好。

binary_search_insertion.cpp

/* 二分查找插入點（存在重復元素） */
int binarySearchInsertion(vector<int> &nums, int target) {
    int i = 0, j = nums.size() - 1; // 初始化雙閉區(qū)間 [0, n-1]
    while (i <= j) {
        int m = i + (j - i) / 2; // 計算中點索引 m
        if (nums[m] < target) {
            i = m + 1; // target 在區(qū)間 [m+1, j] 中
        } else if (nums[m] > target) {
            j = m - 1; // target 在區(qū)間 [i, m-1] 中
        } else {
            j = m - 1; // 首個小于 target 的元素在區(qū)間 [i, m-1] 中
        }
    }
    // 返回插入點 i
    return i;
}

Tip

本節(jié)的代碼都是“雙閉區(qū)間”寫法。有興趣的讀者可以自行實現(xiàn)“左閉右開”寫法。

總的來看，二分查找無非就是給指針 i 和 j分別設定搜索目標，目標可能是一個具體的元素（例如 target ），也可能是一個元素范圍（例如小于 target 的元素）。

在不斷的循環(huán)二分中，指針 i 和 j 都逐漸逼近預先設定的目標。最終，它們或是成功找到答案，或是越過邊界后停止。

以上內容是否對您有幫助：

← C++二分查找

C++二分查找邊界 →

寫筆記

我要補充