本题目摘自《Python程序员面试算法宝典》,我会每天做一道这本书上的题目,并分享出来,统一放在我博客内,收集在一个分类中。

【百度面试题】

难度系数:⭐⭐⭐

考察频率:⭐⭐⭐⭐

题目描述:数字1 ~ 1000放在含有1001个元素的数组中,其中只有唯一的一个元素重复,其他数字均只出现一次。设计一个算法,将重复元素找出来,要求每个数组元素只能访问一次。

进阶:在上面题目描述中,如果不使用辅助空间,能否设计一个算法实现?

方法一:空间换时间

首先分析题目所要达到的目标以及其中的限定条件。从题目中可以发现,本题的目标是在一个有且仅有一个元素重复的数组中找到这个唯一的重复元素,限定条件是每个数组元素只能访问一次。

在不考虑进阶条件的情况下,我们可以通过字典的key来进行去重,我们可以把数字当作key,出现的次数记作value

from collections import defaultdict

def find_elem(array):
dic = defaultdict(lambda : 0) # 构造一个缺省字典,当出现KeyError的时候压制,并创建键值对为key - 0
for elem in array:
if dic[elem] == 1: # 这一步如果dic中没有elem不会报错因为dic是defaultdict
return elem
dic[elem] += 1
return "can't find it" print(find_elem([1, 3, 4, 2, 5, 3])) # 3 # 如果defaultdict看不懂可以看下面使用get方法的版本 def find_elem(array):
dic = {} # 使用普通字典
for elem in array:
dic[elem] = dic.get(elem, 0) + 1 # get不到elem会返回0, 然后再+1,再创建 k - v 对
if dic[elem] == 2: # 重复的元素
return elem
return "can't find it"

这种方法很容易想到,时间复杂度为O(n),空间复杂度也是O(n),这种思想在工作中可以使用,比如一个项目急着上线,没有什么时间给你雕琢程序,那么我们可以考虑使用空间来换取程序运行的时间。

方法二:累加求和法

计算机技术与数学本身是一家,抛开计算机专业知识不提,这个问题可以回归成一个数学问题。数学问题的目标是在一个数字序列中寻找重复的那个数。题目描述是1 ~ 1000个数,有一个重复,那么我们把这1001个数加起来再减去 (1 + 2 + … + 1000)得到的就是重复的那个数了。

def find_it(array):
sum = 0
one_to_thousand = -1001
for i, v in enumerate(array, 1):
sum += v
one_to_thousand += i
return sum - one_to_thousand print(find_it([i for i in range(1, 1001)] + [56]))

分析:时间复杂度O(n), 空间复杂度O(1),但是计算也挺费时间的。 其实这里可以使用python的第三方库,科学计算库numpy进行并行计算,numpy.array.sum()

方法三:异或法

根据异或运算的性质可以直到,当相同元素异或时,运算结果为0,当相异元素异或时,运算结果非0,任何数字与数字0进行异或运算,其运算结果为该数。因为1001个数字是1 ~ 1000再加上一个大于0小于等于1000的数字,所以我们把这1001个数字和1到1000异或,最后会转变成0和重复的那个数字进行异或,得到的就是重复的数字。

例如数组(1, 3, 4, 2, 5, 3),进行运算:(1, 3, 4, 2, 5, 3)^ (1, 2, 3, 4, 5) = 1 ^ 1 ^ 2 ^ 2 ^ 3 ^ 3 ^ 4 ^ 4 ^ 5 ^ 5 ^ 3 = 0 ^ 3 = 3。

def find_it(array):
elem = 0
for i, v in enumerate(array):
elem ^= i ^ v
return elem print(find_it([1, 3, 4, 2, 5, 3]))

这种方法的时间复杂度是O(n), 没有申请额外的存储空间,进行位运算速度还算快。

方法四:数据映射法

数据的取值操作可以看作是一个特殊的函数f:D —> R, 定义域D为下标值 0 ~ 1000,值域为1 ~ 1000, 如果对任意一个数 i, 把f(i)叫做它的后继, i叫做f(i)的前驱。重复的那个数字有两个前驱,所以我们可以把每个数的前驱置为负数,当第二次遇到重复的数字时,它的前驱已经被置为负数了,这个就是重复的数值,返回即可。

# 数据影射法
def find_it(array):
p = 0
while array[p] >= 0:
p = array[p]
array[p] *= -1
return abs(array[p]) print(find_it([1, 2, 4, 2, 5, 3])) # 2
print(find_it([1, 3, 4, 2, 5, 3])) # 3

这个算法的时间复杂度是O(n),没有申请辅助的空间。但是这种方法修改了原本列表中的元素。



欢迎小伙伴们加入我创建的python交流群:625988679



python经典面试算法题4.1:如何找出数组中唯一的重复元素的更多相关文章

  1. python经典面试算法题1.4:如何对链表进行重新排序

    本题目摘自<Python程序员面试算法宝典>,我会每天做一道这本书上的题目,并分享出来,统一放在我博客内,收集在一个分类中. 1.4 对链表按照如下要求重新排序 [微软笔试题] 难度系数: ...

  2. python经典面试算法题1.3:如何计算两个单链表所代表的数之和

    本题目摘自<Python程序员面试算法宝典>,我会每天做一道这本书上的题目,并分享出来,统一放在我博客内,收集在一个分类中. 1.2 如何实现链表的逆序 [华为笔试题] 难度系数:⭐⭐⭐ ...

  3. python经典面试算法题1.2:如何从无序链表中移除重复项

    本题目摘自<Python程序员面试算法宝典>,我会每天做一道这本书上的题目,并分享出来,统一放在我博客内,收集在一个分类中. 1.2 如何实现链表的逆序 [蚂蚁金服面试题] 难度系数:⭐⭐ ...

  4. python经典面试算法题1.1:如何实现链表的逆序

    本题目摘自<Python程序员面试算法宝典>,我会每天做一道这本书上的题目,并分享出来,统一放在我博客内,收集在一个分类中. 1.1 如何实现链表的逆序 [腾讯笔试题] 难度系数:⭐⭐⭐ ...

  5. 一起来刷《剑指Offer》-- 题目一:找出数组中重复的数字(Python多种方法实现)

    数组中重复的数字 最近在复习算法和数据结构(基于Python实现),然后看了Python的各种"序列"--比如列表List.元组Tuple和字符串String,后期会写一篇博客介绍 ...

  6. 找出数组中出现次数超过一半的数,现在有一个数组,已知一个数出现的次数超过了一半,请用O(n)的复杂度的算法找出这个数

    找出数组中出现次数超过一半的数,现在有一个数组,已知一个数出现的次数超过了一半,请用O(n)的复杂度的算法找出这个数 #include<iostream>using namespace s ...

  7. python找出数组中第二大的数

    #!usr/bin/env python #encoding:utf-8 ''''' __Author__:沂水寒城 功能:找出数组中第2大的数字 ''' def find_Second_large_ ...

  8. C++经典面试算法题

    转自:http://blog.csdn.net/f_r_e_e_x/article/details/50770907 //1.实现strcpy. char* MyStrCpy( char *pDest ...

  9. 算法面试题(python)——如何找出数组中出现一次的数

    题目描述: 一个数组里,除了三个数是唯一出现的,其余的数都出现了偶数次,找出这三个数中任意一个.比如数组序列为[1,2,4,5,6,4,2],只有1.5.6这三个数字是唯一出现的,数字2.4均出现了偶 ...

随机推荐

  1. 编程杂谈——使用emplace_back取代push_back

    近日在YouTube视频上看到关于vector中emplace_back与push_back区别的介绍,深感自己在现代C++中还是有不少遗漏的知识点,遂写了段代码,尝试比较两者的差别. 示例代码 #i ...

  2. Java字符串课后作业

    [实验任务] 1.实验题目:字串加密 2.实验内容:古罗马皇帝凯撒在打仗时曾经使用过以下方法加密军事情报:

  3. eventfd(2) 结合 select(2) 源码分析

    eventfd(2) 结合 select(2) 源码分析 本文代码选自内核 4.17 eventfd(2) - 创建一个文件描述符用于事件通知. 使用 源码分析 参考 #include <sys ...

  4. 云上的芯脏病:奇怪的阿里云 RDS 数据库突发 CPU 近 100% 问题

    最近遇到了奇怪的阿里云 RDS 数据库突发 CPU 近 100% 问题,遇到了3次. 第一次是10月12日(周六)凌晨 3:24 负载极低的时候开始出现,早上发现后进行了主备切换,恢复了正常. 第二次 ...

  5. Python之string模块(详细讲述string常见的所有方法)

    相信不少学习python的程序员都接触过string模块 string模块主要包含关于字符串的处理函数 多说无益,初学python的小伙伴还不赶紧码起来 接下来将会讲到字符串的大小写.判断函数. 以及 ...

  6. Python之反射机制

    什么是反射? 1.有时我们要访问某个变量或是方法时并不知道到底有没有这个变量或方法,所以就要做些判断.判断是否存在字符串对应的变量及方法.2.我们知道访问变量时是不能加引号的,否则会被当成字符串处理. ...

  7. 03 【PMP】组织结构类型的优缺点和适用范围包括哪些

    一.职能型组织优点:1.强大的技术支持,便于交流:2.清晰的职业生涯晋升路线:3.直线沟通.交流简单.责任和权限很清晰:4.有利于重复性工作为主的过程管理 职能型组织缺点:1.智能利益优先于项目,具有 ...

  8. if-elif-else分支判断语句(附加continue和break)---举例说明

    一.分支循环语句: a=input("请输入一个五位数字") if(len(a)!=5): print("输入的数字不合格"); elif(a[0::]==a[ ...

  9. cxf 调用 .net webservice

    1.   问题背景          现在我们两套语言并行,其中必然会涉及到不同系统的相互访问. .net 的会员信息是用 webservice  提供服务的.那如何对现有 .net webservi ...

  10. 远程桌面连接(mstsc)

    目录 1. 序言 2. 准备工作 3. 内网远程连接(以mstsc的方式) 4. 问题---凭据不工作 5. 外网远程连接(mstsc) 6. 结语 更新时间:2019.09.10 1. 序言 有时候 ...