Python算法概述(1)

一、算法简介

1、定义

算法是一组完成任务的指令;有限步骤内解决数学问题的程序;为解决某项工作或某个问题,所需要有限数量的机械性或重复性指令与计算步骤。

2、算法的条件(5)

输入性,输出性,明确性,有限性,有效性。

3、时间复杂度

O(1) < O(logn) < O(n) < O(nlogn) < O(n^2) < O(n!)

4、常见的大O运行时间(n一般为元素的个数):

  • O(logn):对数时间,例如:二分查找
  • O(n): 线性时间,简单查找
  • O(nlogn): 快速排序
  • O(n^2):选择排序
  • O(n!):旅行商问题解决方案

5、常见的算法简介:

  • 分治法:

  • 递归法:
    (1)递归函数分为两部分:
    ① 基线条件:基线条件是指函数不再调用自己,从而避免形成无限循环
    ② 递归条件:指函数调用自己
    Python算法概述(1)_第1张图片

  • 贪心法:

  • 动态规划法:

  • 迭代法:

  • 枚举法:

  • 回溯法:

二、常用的数据结构

1、概念:

  • 何为数据?:数据是指一种未经处理的原始文字、数字、符号或图形等。可分为两大类:一类为数值数据,另一类为字符数据;
  • 数据结构是相互之间存在一种或多种特定关系的数据元素的集合,即带“结构”的数据元素的集合。“结构”就是指数据元素之间存在的关系,分为逻辑结构和存储结构。

2、数据结构的种类

  • 数组
    (1)、数组结构其实就是一排紧密相邻的可数内存,并提供一个能够直接访问单一数据内容的计算方法。
    (2)、一维数组
    声明一个一维数组:Score[0] * 5
    (3)、二维数组
    声明一个二维数组:number=[[1,2,4],[1,3,4],[,4,5,7]]
    (4)、三维数组
    声明一个三维数组:
    arr=[[[1,2,4],[1,3,4],[,4,5,7]],[[1,2,4],[1,3,4],[,4,5,7]],[[1,2,4],[1,3,4],[,4,5,7]]]
    (5)、数组支持随机访问

  • 链表
    (1)、链表是许多相同数据类型的数据项按特定顺序排序而成的线性表。其特性是各个数据项在计算机内存中的位置是不连续的且随机存放的;
    优点:数据的插入或删除都相当方便。
    缺点:设计数据结构比较麻烦。
    (2)、链表支持顺序访问

  • 堆栈
    (1)、一组相同数据类型的组合,具有“后进先出”的特性
    (2)、基本运算
    creat: 创建一个空栈
    push: 把数据压入栈顶,并返回新堆栈
    pop: 从栈顶弹出数据,并返回新堆栈
    isEmpty: 判断堆栈是否为空堆栈,是返回“true”,否则返回“false”
    full: 判读堆栈是否已满,是返回“true”,否则返回“false”

  • 队列
    (1)、一种“先进先出”的数据结构
    (2)、基本操作
    creat:创建空队列
    add: 将数据加入到队列的末尾,返回新队列
    delete: 删除队列前端的数据,返回新队列
    front: 返回队列前端的值
    empty: 若队列为空,是返回“真”,否则返回“假”

树形结构

Python算法概述(1)_第2张图片

(1)、树的基本概念
树是N (N >= 0 )个结点的有限集合,N = 0 时,称为空树,这是一种特殊情况。在任意一棵非空树中应满足:
1) 有且仅有一个特定的称为根的结点。
2)当 N > 1 时,其余结点可分为 m ( m > 0)个互不相交的有限集合T1 , T2 , T3 , … Tm ,其中每一个集合本身又是一棵树,并且称为根结点的子树。
(2)、概念介绍:
① 度数:每个节点所有子树的个数。
② 层数:树的层。
③ 高度:树的最大层数
④ 树叶或终端节点:度数为零的就是叶子节点
⑤ 父节点:每一个节点有连接的上一层节点
⑥ 子节点:每一个节点有连接的下一层节点
⑦ 祖先或子孙:
是指树根到该节点路径上所包含节点,而子孙节点是在该节点往下追溯子树中的任一节点
⑧ 兄弟节点:有共同父节点的节点为兄弟节点
⑨ 非终端节点:树叶以外的节点
⑩ 同代:在同一颗中具有相同层数的节点
⑪ 森林:n棵(n >= 0)互斥树的集合

二叉树

Python算法概述(1)_第3张图片

(1)、二叉树是一个由有限节点所组成的集合,此集合可为空集合,或由一个树根及其左右两个子树所组成。简单说,二叉树最多只能有两个子节点,度数<=2
二叉树的数据结构:
在这里插入图片描述

二叉树和一般树的不同如下:
① 树不可为空集合,但二叉树可以
② 树的度数为d>=0,但二叉树的节点度数为:0<=d<=2
③ 树的子树间没有次序关系,二叉树则有

图形结构

(1)、图形定义
图是由“顶点”和“边”所组成的集合,通常用G=(V,E),V代表所有顶点组成的集合,E代表所有边组成的集合。图的种类有两种:一种是无向图,一种是有向图,无向图以(V1,V2)表示其边,而有向图则以表示其边。

哈希表
哈希表是一种存储记录的连续内存,通过哈希函数的应用,可以快速存取和查找数据。基本上,哈希表就是本身的键值,通过特定的数学函数运算或使用其他的方法,转成相应的数据存储地址。
(1)、哈希函数的相关名词

  • Bucket(桶):哈希表中存储数据的位置,每一个位置对应到唯一的一个地址(bucket address)。桶就好比一个记录;
  • Slot(槽):每一个记录中可能包含好几个字段,而slot指的就是桶中的字段;
  • Collision(碰撞):两项不同的数据,经过哈希函数运算后,对应到相同的地址。
  • 溢出:如果数据经过哈希函数运算后,所对应到的bucket已满,就会使bucket发生溢出。
  • 哈希表:存储记录的连续内存,哈希表是一种类似数据表的索引表格,可分为n个bucket,每个bucket又可分为m个slot。
  • 同义词(Synonym):两个标识符I1和I2经哈希函数运算后所得的数值相同,即f(I1)=f(I2)
  • 加载密度(Loading Factor):所谓加载密度是指标识符的使用数量除以哈希内槽的总数:
    ժ(加载密度)= n(标识符的使用数目)/ [ s(每一个桶内的槽数)* b(桶的数目)]
    Ժ 值越大,表示哈希空间使用率越高,碰撞或溢出的概率也会越高
  • 完美哈希(Perfect Hashing):没有碰撞也没有溢出的哈希函
    (2)、设计哈希函数时应遵循的原则
    ① 降低碰撞和溢出的产生
    ② 哈希函数不宜过于复杂,越容易计算越佳
    ③ 尽量把文字的键值转成数字的键值,以利于哈希函数的计算
    ④ 所设计的哈希函数计算得到的值,尽量能均匀分布在每一桶中,不要过于集中某个桶内,这样可以降低碰撞,并减少溢出的处理。

三、排序算法

3.1、内存的工作原理

  • 需要将数据存储到内存时,请求计算机提供存储空间,计算机分配一个存储地址。
  • 需存储多项数据时,可以根据情况选择数组还是链表。

3.2、何为排序?

  • 指将一则数组,按特定规则调换位置,使数据具有某种顺序关系(递增或是递减)
  • 在排序过程中,数据移动方式可分为“直接移动”和“逻辑移动”两种。“直接移动”是直接交换存储数据的位置,而“逻辑移动”并不会移动数据存储的位置,仅改变指向这些数据的辅助指针的值。

3.3、选择排序

  • 选择排序也是枚举法的应用,反复从未排序的数列中取出最小元素,加入到另一个数列中,最后的结果即为已排序的数列。

  • 选择排序可使用两种方式排序:
    ① 在所有数据中,从小到大排序,将最大值放入第一个位置
    ② 从小到大排序,将最大值放入最后一个位置

  • 时间复杂度
    ① 选择排序是一种灵巧的算法,但速度不是很快
    ② 时间复杂度:O(n*n)

  • 应用场景
    ① 电话簿中的人名排序
    ② 旅行日期的安排
    ③ 电子邮件按时间排序(新到旧)

3.4、冒泡排序

  • 冒泡排序法又称高效排序法,是从观察水中气泡变化构思而成,原理是从第一个元素开始,比较相邻元素的大小,若大小顺序有误,则对调后再进行下一个元素的比较,就像气泡从水底逐渐冒升到水面上一样。如此扫描过一次之后就可确保最后一个元素位于正确的顺序。接着逐步进行第二次扫描,直到完成所有元素的排序关系为止。

3.5、插入排序

插入排序是将数组中的元素,逐一与已排好的数据进行比较,前两个元素先排好,再将第三个元素插入适当的位置,所以这三个元素仍然是已排序好的,接着第四个元素加入,重复此步骤,直到排序完成位置。可看作是一串有序的记录:R1、R2、…Ri中,插入新的记录R,使得i+1个记录排序妥当

3.6、希尔排序

  • “希尔排序”是D.L.Shell在1959年7月所发明的一种排序法,可减少插入排序中数据搬移的次数,以加速排序的进行。
  • 排序的原则是将数据区分成特定间隔的几个小区块,以插入排序法排序完区块内的数据后再逐渐减少间隔的距离。

3.7、合并排序

合并排序(Merge)的工作原理是针对已排好的两个或两个以上的数列(或数据文件),通过合并的方式,将其组合成一个大的且已排好的数列(或数据文件)
步骤如下:
① 将N个长度为1的键值,成对地合并成N/2个长度为2的键值组。
② 将N/2个长度为2的键值组,成对地合并成N/4个长度为4的键值组
③ 将键值组不断地合并,直到合并成一组长度为N的键值组为止

3.8、快速排序

快速排序(Quick Sort)是由C.A.R.Hoare所提出的。又称分割交换排序法,目前公认最佳的排序法,也是使用“分而治之”的方式,先在数据中找到一个虚拟的中间值,并且按此中间值将所有打算排序的数据分为两部分。其中小于中间值的数字在左边,大于中间值的数字在右边,再以同样的方式分别处理左、右两边的数据,直到排序完成为止。
操作分割的步骤:
假设有n项记录R1、R2、R3…Rn,其键值为k1,k2,k3…kn:
① 假设K的值为第一个键值
② 从左向右找到键值Ki,使得Ki >K
③ 从右向左找到键值Kj,使得Kj ④ 如果i < j,那么Ki与Kj互换,并且回到步骤②
⑤ 若i >= j则将K与Kj交换,并以j为基准点分割成左右部分。然后针对左右两边进 行步骤①至⑤,直到左半边键值等于右半边键值

3.9、基数排序

基数排序法按比较的方向可分为最高优先(Most Significant Digit First,MSD)和最低优先(Least Significant Digit First,LSD)两种。MSD法是从最左边的位数开始比较,而LSD从最右边的位数开始比较。

你可能感兴趣的:(Python,python,算法)