跳到主要内容

哈希查找

前言

二分查找的前提是数据集有序,对于无序的数据集,除了线性查找,还可以使用哈希查找。以“两数之和”题为例:

给定一个整数数组 nums 和一个目标元素 target ,请在数组中搜索“和”为 target 的两个元素,并返回它们的数组索引。返回任意一个解即可。

线性查找

def two_sum_brute_force(nums: list[int], target: int) -> list[int]:
"""方法一:暴力枚举"""
# 两层循环,时间复杂度为 O(n^2)
for i in range(len(nums) - 1):
for j in range(i + 1, len(nums)):
if nums[i] + nums[j] == target:
return [i, j]
return []

此方法的时间复杂度为 O(n2)O(n^2) ,空间复杂度为 O(1)O(1) ,在大数据量下非常耗时。

哈希查找

借助一个哈希表,键值对分别为数组元素和元素索引。循环遍历数组,每轮执行以下步骤

  1. 判断数字 target - nums[i] 是否在哈希表中,若是,则直接返回这两个元素的索引。
  2. 将键值对 nums[i] 和索引 i 添加进哈希表。
def two_sum_hash_table(nums: list[int], target: int) -> list[int]:
"""方法二:辅助哈希表"""
# 辅助哈希表,空间复杂度为 O(n)
dic = {}
# 单层循环,时间复杂度为 O(n)
for i in range(len(nums)):
if target - nums[i] in dic:
return [dic[target - nums[i]], i]
dic[nums[i]] = i
return []

"""Driver Code"""
if __name__ == "__main__":
nums = [2, 7, 11, 15]
target = 13
res = two_sum_hash_table(nums, target)

此方法通过哈希查找将时间复杂度从 O(n2)O(n^2) 降至 O(n)O(n) ,大幅提升运行效率。