随机数索引
给定一个可能含有重复元素的整数数组,要求随机输出给定的数字的索引。 您可以假设给定的数字一定存在于数组中。 注意: 数组大小可能非常大。 使用太多额外空间的解决方案将不会通过测试。 来源:力扣(LeetCode) 链接:https://leetcode-cn.com/problems/random-pick-index 著作权归领扣网络所有。商业转载请联系官方授权,非商业转载请注明出处。
AC代码class Solution:
def __init__(self, nums: List[int]):
self.pos = defaultdict(list)
for i, n in enumerate(nums):
self.pos[n].append(i)
def pick(self, target: int) -> int:
return choice(self.pos[target])
# Your Solution object will be instantiated and called as such:
# obj = Solution(nums)
# param_1 = obj.pick(target)
官方代码
class Solution:
def __init__(self, nums: List[int]):
self.nums = nums
def pick(self, target: int) -> int:
ans = cnt = 0
for i, num in enumerate(self.nums):
if num == target:
cnt += 1 # 第 cnt 次遇到 target
if randrange(cnt) == 0:
ans = i
return ans
#作者:LeetCode-Solution
1、defaultdict是collections中的一个方法,可以对当前不存在的键赋初值为[],类似于dict.setdefalut(n,[])的作用 2、choice方法可以等概率的随机返回列表、元组等中的一个元素 3、水塘抽样是一个很好的方法,通过后续有概率覆盖,使得遍历后每一个符合条件的元素的出现概率都相等,唯一的缺点是不管任何元素都需要完整的遍历一遍整个数组。 4、choice方法本质需要一个存放所有元素的哈希表,而水塘抽样虽然需要存储nums,但似乎这并不计算在其空间开销之内,那么这样的话其空间复杂度就是常数级的了。两者可以看做空间和时间的平衡