day39 算法基础

参考博客：

http://www.cnblogs.com/alex3714/articles/5474411.html
http://www.cnblogs.com/wupeiqi/articles/5480868.html

第一部分算法简单概念

算法概念
复习：递归
时间复杂度
空间复杂度

什么是算法？

算法（Algorithm）：一个计算过程，解决问题的方法

复习：递归

递归的两个特点：
- 调用自身
- 结束条件
看下面几个函数：

递归：练习

时间复杂度

看代码：

- print('Hello World')

- for i in range(n):
- 　　print('Hello World')

- for i in range(n):
- 　　for j in range(n):
- 　　　　print('Hello World')

- for i in range(n):
- 　　for j in range(n):
- 　　　　for k in range(n):
- 　　　　　　print('Hello World')

 上面四组代码，哪组运行时间最短？

 用什么方式来体现代码（算法）运行的快慢？

类比生活中的一些事件，估计时间：
- 眨一下眼　　一瞬间/几毫秒
- 口算“29+68” 几秒
- 烧一壶水几分钟
- 睡一觉几小时
- 完成一个项目几天/几星期/几个月
- 飞船从地球飞出太阳系几年
时间复杂度：用来评估算法运行效率的一个东西

那这些代码呢？

那这个代码呢？

时间复杂度-小结
- 时间复杂度是用来估计算法运行时间的一个式子（单位）。
- 一般来说，时间复杂度高的算法比复杂度低的算法慢。
- 常见的时间复杂度（按效率排序）
  - O(1)<O(logn)<O(n)<O(nlogn)<O(n2)<O(n2logn)<O(n3)
- 不常见的时间复杂度（看看就好）
  - O(n!) O(2n) O(nn) …
- 如何一眼判断时间复杂度？
  - 循环减半的过程O(logn)
  - 几次循环就是n的几次方的复杂度

空间复杂度

空间复杂度：用来评估算法内存占用大小的一个式子
“空间换时间”

列表查找

列表查找：从列表中查找指定元素
- 输入：列表、待查找元素
- 输出：元素下标或未查找到元素
顺序查找
- 从列表第一个元素开始，顺序进行搜索，直到找到为止。
二分查找
- 从有序列表的候选区data[0:n]开始，通过对待查找的值与候选区中间值的比较，可以使候选区减少一半。

二分查找

使用二分查找来查找3

列表查找-代码

递归版本的二分查找

def bin_search_rec(data_set, value, low, high):

    if low <= high:

        mid = (low + high) // 2

        if data_set[mid] == value:

            return mid

        elif data_set[mid] > value:

            return bin_search_rec(data_set, value, low, mid - 1)

        else:

            return bin_search_rec(data_set, value, mid + 1, high)

    else:

        return

列表查找：练习

现有一个学员信息列表（按id增序排列），格式为：

[

{id:1001, name:"张三", age:20},

{id:1002, name:"李四", age:25},

{id:1004, name:"王五", age:23},

{id:1007, name:"赵六", age:33}

]

修改二分查找代码，输入学生id，输出该学生在列表中的下标，并输出完整学生信息。

Letcode

34. Search for a Range (二分查找升级版)

1. Two Sum

列表排序

列表排序
- 将无序列表变为有序列表
应用场景：
- 各种榜单
- 各种表格
- 给二分排序用
- 给其他算法用
输入：无序列表
输出：有序列表
升序与降序
排序low B三人组：
- 冒泡排序
- 选择排序
- 插入排序
快速排序
排序NB二人组：
- 堆排序
- 归并排序
没什么人用的排序：
- 基数排序
- 希尔排序
- 桶排序

排序Low B三人组

大家自己能想到怎么完成一次排序吗？
冒泡排序
选择排序
插入排序
算法关键点：
- 有序区
- 无序区

冒泡排序思路

首先，列表每两个相邻的数，如果前边的比后边的大，那么交换这两个数……
会发生什么？

代码关键点：
- 趟
- 无序区

冒泡排序代码

def bubble_sort(li):

    for i in range(len(li)-1):

        for j in range(len(li)-i-1):

            if li[j] > li[j+1]:

                li[j], li[j+1] = li[j+1], li[j]

时间复杂度：O(n2)
冒泡排序-优化
- 如果冒泡排序中执行一趟而没有交换，则列表已经是有序状态，可以直接结束算法。

def bubbole_sort_1(li):

    for i in range(len(li)-1):

        exchange = False

        for j in range(len(li)-i-1):

            if li[j] > li[j+1]:

                li[j],li[j+1] = li[j+1],li[j]

                exchange = True

        if not exchange:

            return

选择排序思路
- 一趟遍历记录最小的数，放到第一个位置；
- 再一趟遍历记录剩余列表中最小的数，继续放置；
- ……
- 问题是：怎么选出最小的数？
代码关键点：
- 无序区
- 最小数的位置
选择排序代码

def select_sort(li):

   for i in range(len(li) - 1):

      min_loc = i

      for j in range(i+1, len(li)):

        if li[j] < li[min_loc]:

            min_loc = j

      if min_loc != i:

        li[i], li[min_loc] = li[min_loc], li[i]

时间复杂度：O(n2)
插入排序思路

列表被分为有序区和无序区两个部分。最初有序区只有一个元素。
每次从无序区选择一个元素，插入到有序区的位置，直到无序区变空。

代码关键点：

摸到的牌
手里的牌

 def insert_sort(li):

     for i in range(1, len(li)):

         tmp = li[i]

         j = i - 1

         while j >= 0 and tmp < li[j]:

             li[j + 1] = li[j]

             j = j - 1

         li[j + 1] = tmp

代码

时间复杂度：O(n2)
优化空间：应用二分查找来寻找插入点（并没有什么卵用）

小结——排序LOW B三人组

冒泡排序插入排序选择排序
时间复杂度：O(n2)
空间复杂度：O(1)

快速排序

快速排序：快
- 好写的排序算法里最快的
- 快的排序算法里最好写的
快速排序思路　　
- 取一个元素p（第一个元素），使元素p归位；
- 列表被p分成两部分，左边都比p小，右边都比p大；
- 递归完成排序。

算法关键点：
- 整理
- 递归

 def quick_sort(data, left, right):

        if left < right:

            mid = partition(data, left, right)

            quick_sort(data, left, mid - 1)

            quick_sort(data, mid + 1, right)

快速排序代码——第一步

怎么写partition函数

 def partition(data, left, right):

     tmp = data[left]

     while left < right:

         while left < right and data[right] >= tmp:

             right -= 1

         data[left] = data[right]

         while left < right and data[left] <= tmp:

             left += 1

         data[right] = data[left]

     data[left] = tmp

     return left

快速排序代码——第二步

还不理解partition函数？

def partition(data, left, right):

    tmp = data[left]

    while left < right:

        while left < right and data[right] >= tmp:

            right -= 1

        data[left] = data[right]

        while left < right and data[left] <= tmp:

            left += 1

        data[right] = data[left]

    data[left] = tmp

    return left

快速排序-如何

效率
- 快速排序真的比冒泡排序快吗？
- 为什么快了？
- 快了多少？
问题
- 最坏情况
- 递归

快速排序-练习

如果想将列表进行降序排序，应该修改哪些符号？
还是对于刚才那个学生信息表，修改快速排序代码，使其能够进行排序。

堆排序前传——树与二叉树简介

树是一种数据结构比如：目录结构
树是一种可以递归定义的数据结构
树是由n个节点组成的集合：
- 如果n=0，那这是一棵空树；
- 如果n>0，那存在1个节点作为树的根节点，其他节点可以分为m个集合，每个集合本身又是一棵树。
一些概念
- 根节点、叶子节点
- 树的深度（高度）
- 树的度
- 孩子节点/父节点
- 子树

特殊且常用的树——二叉树

二叉树：度不超过2的树（节点最多有两个叉）

两种特殊二叉树
- 满二叉树
- 完全二叉树

二叉树的存储方式

- 链式存储方式
- 顺序存储方式（列表）
父节点和左孩子节点的编号下标有什么关系？
- 0-1 1-3 2-5 3-7 4-9

- i – 2i+1

父节点和右孩子节点的编号下标有什么关系？
- 0-2 1-4 2-6 3-8 4-10
- i – 2i+2
比如，我们要找根节点左孩子的左孩子

二叉树小结

二叉树是度不超过2的树
满二叉树与完全二叉树
（完全）二叉树可以用列表来存储，通过规律可以从父亲找到孩子或从孩子找到父亲

堆排序

大根堆：一棵完全二叉树，满足任一节点都比其孩子节点大

小根堆：一棵完全二叉树，满足任一节点都比其孩子节点小

堆这个玩意…
- 假设：节点的左右子树都是堆，但自身不是堆

- 当根节点的左右子树都是堆时，可以通过一次向下的调整来将其变换成一个堆。
堆排序过程
- 建立堆
- 得到堆顶元素，为最大元素
- 去掉堆顶，将堆最后一个元素放到堆顶，此时可通过一次调整重新使堆有序。
- 堆顶元素为第二大元素。
- 重复步骤3，直到堆变空。
构造堆

挨个出数

 def sift(data, low, high):

     i = low

     j = 2 * i + 1

     tmp = data[i]

     while j <= high:

         if j < high and data[j] < data[j + 1]:

             j += 1

         if tmp < data[j]:

             data[i] = data[j]

             i = j

             j = 2 * i + 1

         else:

             break

     data[i] = tmp

 def heap_sort(data):

     n = len(data)

     for i in range(n // 2 - 1, -1, -1):

         sift(data, i, n - 1)

     for i in range(n - 1, -1, -1):

         data[0], data[i] = data[i], data[0]

         sift(data, 0, i - 1)

堆排序代码

归并排序

假设现在的列表分两段有序，如何将其合成为一个有序列表

这种操作称为一次归并。

 def merge(li, low, mid, high):

     i = low

     j = mid + 1

     ltmp = []

     while i <= mid and j <= high:

         if li[i] <= li[j]:

             ltmp.append(li[i])

             i += 1

         else:

             ltmp.append(li[j])

             j += 1

     while i <= mid:

         ltmp.append(li[i])

         i += 1

     while j <= high:

         ltmp.append(li[j])

         j += 1

     li[low:high + 1] = ltmp

一次归并代码

有了归并怎么用？

分解：将列表越分越小，直至分成一个元素。
一个元素是有序的。
合并：将两个有序列表归并，列表越来越大。

def mergesort(li, low, high):

    if low < high:

        mid = (low + high) // 2

        mergesort(li, low, mid)

        mergesort(li, mid + 1, high)

        merge(li, low, mid, high)

归并排序

快速排序、堆排序、归并排序-小结

三种排序算法的时间复杂度都是O(nlogn)
一般情况下，就运行时间而言：
- 快速排序 < 归并排序 < 堆排序
三种排序算法的缺点：
- 快速排序：极端情况下排序效率低
- 归并排序：需要额外的内存开销
- 堆排序：在快的排序算法中相对较慢

希尔排序思路

希尔排序是一种分组插入排序算法。
首先取一个整数d1=n/2，将元素分为d1个组，每组相邻量元素之间距离为d1，在各组内进行直接插入排序；
取第二个整数d2=d1/2，重复上述分组排序过程，直到di=1，即所有元素在同一组内进行直接插入排序。

希尔排序每趟并不使某些元素有序，而是使整体数据越来越接近有序；最后一趟排序使得所有数据有序。

 def shell_sort(li):

     gap = len(li) // 2

     while gap > 0:

         for i in range(gap, len(li)):

             tmp = li[i]

             j = i - gap

             while j >= 0 and tmp < li[j]:

                 li[j + gap] = li[j]

                 j -= gap

             li[j + gap] = tmp

         gap /= 2

希尔排序

排序-小结

排序-赠品1

现在有一个列表，列表中的数范围都在0到100之间，列表长度大约为100万。设计算法在O(n)时间复杂度内将列表进行排序。

赠品1-计数排序

创建一个列表，用来统计每个数出现的次数。

def count_sort(li, max_num):

    count = [0 for i in range(max_num + 1)]

    for num in li:

        count[num] += 1

    i = 0

    for num,m in enumerate(count):

        for j in range(m):

            li[i] = num

            i += 1

排序-赠品2

现在有n个数（n>10000），设计算法，按大小顺序得到前m大的数。
- 应用场景：榜单TOP 10

赠品2-堆的应用（了解）

解决思路：取列表前10个元素建立一个小根堆。堆顶就是目前第10大的数。
依次向后遍历原列表，对于列表中的元素，如果小于堆顶，则忽略该元素；如果大于堆顶，则将堆顶更换为该元素，并且对堆进行一次调整；
遍历列表所有元素后，倒序弹出堆顶。

def topn(li, n):

    heap = li[0:n]

    # 建堆

    for i in range(n // 2 - 1, -1, -1):

        sift(heap, i, n - 1)

    # 遍历

    for i in range(n, len(li)):

        if li[i] > heap[0]:

            heap[0] = li[i]

            sift(heap, 0, n - 1)

    # 出数

    for i in range(n - 1, -1, -1):

        heap[0], heap[i] = heap[i], heap[0]

        sift(heap, 0, i - 1)

解决方案

赠品2-堆的应用（了解）

优先队列：一些元素的集合，POP操作每次执行都会从优先队列中弹出最大（或最小）的元素。
堆——优先队列
Python内置模块——heapq 利用heapq模块实现堆排序

利用heapq模块实现取top-k
- heapq.nlargest(100, li)

算法-习题1

给定一个列表和一个整数，设计算法找到两个数的下标，使得两个数之和为给定的整数。保证肯定仅有一个结果。
例如，列表[1,2,5,4]与目标整数3，1+2=3，结果为(0, 1).
https://leetcode.com/problems/two-sum/?tab=Description

算法-习题2

给定一个升序列表和一个整数，返回该整数在列表中的下标范围。
例如：列表[1,2,3,3,3,4,4,5]，若查找3，则返回(2,4)；若查找1，则返回(0,0)。
https://leetcode.com/problems/search-for-a-range/description/

day39 算法基础的更多相关文章

Levenberg-Marquardt算法基础知识
Levenberg-Marquardt算法基础知识 (2013-01-07 16:56:17) 转载▼ 什么是最优化?Levenberg-Marquardt算法是最优化算法中的一种.最优化是寻找使 ...
解读Raft（一算法基础）
最近工作中讨论到了Raft协议相关的一些问题,正好之前读过多次Raft协议的那paper,所以趁着讨论做一次总结整理. 我会将Raft协议拆成四个部分去总结: 算法基础选举和日志复制安全性节点变 ...
腾讯2017年暑期实习生编程题【算法基础-字符移位】（C++，Python）
算法基础-字符移位时间限制:1秒空间限制:32768K 题目: 小Q最近遇到了一个难题:把一个字符串的大写字母放到字符串的后面,各个字符的相对位置不变,且不能申请额外的空间. 你能帮帮小Q吗? ...
算法基础_递归_求杨辉三角第m行第n个数字
问题描述: 算法基础_递归_求杨辉三角第m行第n个数字(m,n都从0开始) 解题源代码(这里打印出的是杨辉三角某一层的所有数字,没用大数,所以有上限,这里只写基本逻辑,要符合题意的话,把循环去掉就好) ...
毕业设计预习：SM3密码杂凑算法基础学习
SM3密码杂凑算法基础学习术语与定义 1 比特串bit string 由0和1组成的二进制数字序列. 2 大端big-endian 数据在内存中的一种表示格式,规定左边为高有效位,右边为低有效位.数 ...
Python之算法基础
1>递归相关: 递归:递归算法是一种直接或间接地调用自身算法的过程,在计算机编写程序中,递归算法对解决一大类问题是十分有效的,它往往使算法的描述简洁而且易于 ...
Python 迭代器&生成器,装饰器,递归，算法基础：二分查找、二维数组转换，正则表达式，作业：计算器开发
本节大纲迭代器&生成器装饰器基本装饰器多参数装饰器递归算法基础:二分查找.二维数组转换正则表达式常用模块学习作业:计算器开发实现加减乘除及拓号优先级解析用户输入 1 - ...
算法基础：BFS和DFS的直观解释
算法基础:BFS和DFS的直观解释 https://cuijiahua.com/blog/2018/01/alogrithm_10.html 一.前言我们首次接触 BFS 和 DFS 时,应该是在数 ...
2020牛客寒假算法基础集训营2 J题可以回顾回顾
2020牛客寒假算法基础集训营2 A.做游戏这是个签到题. #include <cstdio> #include <cstdlib> #include <cstring ...

随机推荐

python全栈开发从入门到放弃之socket网络编程基础
网络编程基础一客户端/服务器架构 1.硬件C/S架构(打印机) 2.软件C/S架构互联网中处处是C/S架构如黄色网站是服务端,你的浏览器是客户端(B/S架构也是C/S架构的一种) 腾讯作为服务 ...
PL/SQL 创建用户及权限操作
1.创建User create user user01 identified by user01, 2.赋予连接数据库的权限 grant connect to user01; 3.把user00的表E ...
git 移除某个文件的版本管理
1:最简单的,在项目刚创建的时候,在根目录的.gitignore,加入该文件的相对路径 2:已经被纳入到了版本控制,使用在当前目录下,打开cmd窗口输入rm命令,加上文件的绝对路径(相对路径没试过) ...
python中统计计数的几种方法
以下实例展示了 count() 方法的使用方法: 1 2 3 4 5 6 # !/usr/bin/python3 T = (123, 'Google', 'Runoob', 'Taobao', 1 ...
HDU2189 来生一起走
好久没发博客了,最近遇到以下奇葩错误,不明觉厉,忍不住发一篇 /*母函数,因为要求的是素数,那么先打一个素数表,所有的因子都是素数构成但是遇到一个奇葩事,当num初值取1,结果就出不来,运行了好久 ...
GIT使用—补丁与钩子
一.补丁生成补丁 [root@localhost buding]# echo B > file;git add file;git commit -m "B" [master ...
encoder-decoder环境部署问题
pip -v 2.7 cp -r pip2.7 pip pip list appdirs (1.4.3)cycler (0.10.0)distribute (0.7.3)extern (0.1. ...
学号20145303 《Java程序设计》第一周学习总结
学号20145303 <Java程序设计>第一周学习总结教材学习内容总结 *dos命令行: dir:列出当前目录下的文件及文件名 md:创建目录 rd:删除目录.为空时文件夹(文件夹为空 ...
HTML中的figure和gigcaption标签
参考自:anti-time的博客http://www.cnblogs.com/morning0529/p/4198494.html 在写xhtml.html中常常用到一种图片列表,图片+标题或者图片+ ...
CSS控制滚动条的样式
到今天(2018年10月25日)为止, 这还是chrome上的一个实验性特性: ::-webkit-scrollbar{width:4px;height:4px;} ::-webkit-scrollb ...

day39 算法基础

day39 算法基础的更多相关文章

随机推荐

热门专题