数据结构(C语言版)---查找
1、查找表:同一类型的数据元素构成的集合。
2、对查找表进行的操作:查询某特定元素、检索满足条件的元素的属性、插入元素、删除元素。
1)若对查找表进行的操作只涉及前两种,则为静态查找表;需要进行插入和删除,则为动态查找表。
2)适合静态查找表的查找方法:顺序查找、折半查找、散列查找。
3)适合动态查找表的查找方法:二叉排序树(二叉平衡树和B树都是二叉排序树的改进)的查找、散列查找。
3、顺序查找(线性查找):用于在线性表中进行查找。
1)一般线性查找表的顺序查找
(1)对于n个元素的表,查找成功的平均查找长度为ASL成功=Pi(n-i-+1),(从1到N求和)。
(2)当每个元素查找概率相等时,即Pi=1/n,ASL成功=(n+1)/2,ASL失败=n+1。
2)有序表的顺序查找
查找成功的平均查找长度和一般线性查找表的顺序查找一样;查找不成功时ASL失败=n/2+n/(n+1)。
3)一般线性表的存储结构描述
typedef struct {
int * elem;//基地址
int tablelen;//表的长度
}SSTable;
4)在顺序表ST中顺序查找关键字为key的元素
int Seqsearch(SSTable ST, int key)
{
ST.elem[0] = key;
int i;
for ( i = ST.tablelen; ST.elem[i] != key; --i);
return i;
}
5)顺序查找表,找到后和其前面的元素交换
int Seqsrch(SSTable r, int k)
{
int i = 0, temp;
while ((r.elem[i]!=k)&&(i<r.tablelen))
{
i++;
}
if (i < r.tablelen&&i>0)
{
temp = r.elem[i];
r.elem[i] = r.elem[i - 1];
r.elem[i - 1] = temp;
return --i;
}
else
{
return -1;
}
}
4、折半查找(二分查找):仅适用于有序的顺序表。
1)折半查找的过程用二叉树描述,称为判定树。
(1)若有序序列有n个元素,则对应的判定树有n个圆形的非叶结点和n+1个方形叶结点。
(2)当元素个数为n时,树的高度为h=log2(n+1)。
2)查找成功的平均查找长度:ASL成功=log2(n+1)-1,折半查找的时间复杂度为O(log2n)。
3)折半查找的存储结构必须具有随即存取的特性。
4)折半查找---在有序表L中查找关键字为key的元素
int binarysearch(SSTable L, int key)
{
int low = 0, high = L.tablelen - 1, mid;
while (low <= high)
{
mid = (low + high) / 2;
if (L.elem[mid] == key)
{
return mid;
}
else if (L.elem[mid] > key)
{
high = mid - 1;
}
else
{
low = mid + 1;
}
}
return -1;
}
5、有序表的顺序查找和折半查找的区别:有序表的顺序查找中的线性表可以为链式存储结构。
6、分块查找(索引顺序查找)
1)操作:将查找表分成若干块,块内无序,块间有序。
2)将长度为n的查找表均匀的分为b块,每块有s个记录,在等概率情况下:
(1)若在块内和索引表中均采用顺序查找,则平均查找长度为ASL=(b+1)/2+(s+1)/2=(s2+2s+n)/2s;
(2)若s=√n,则平均查找长度取最小值√n+1。
(3)若对索引表采用折半查找,则平均查找长度为ASL=log2(b+1)+(s+1)/2。
7、B树:所有结点的平衡因子均等于0的多路平衡查找树。
1)B树的阶:B树中所有结点的孩子结点数的最大值。
2)m阶B树的性质:
(1)每个结点至多有m棵子树,即至多含有n-1个关键字;
(2)若根结点不是终端节点,则至少有两棵子树;
(3)除根结点外的所有非叶结点至少有m/2棵子树,即至少含有m/2-1个关键字;
(4)非叶结点的结构
n(结点中关键字的个数) | p0 | k1 | p1 | k2 | p2 | ... | kn | pn |
其中,ki为结点的关键字,且k1<k2<...<kn,pi为指向子树根结点的指针,且pi-1所指子树中所有结点的关键字均小于ki,pi所指子树中所有结点的关键字均大于ki;
(5)所有叶结点都出现在同一层次上。
3)B树的高度
若n>=1,则对于任意一棵包含n个关键字、高度为h、阶数为m的B树
(1)h>=logm(n+1);
(2)若让每个结点中的关键字个数达到最少,则容纳同样多关键字的B树的高度达到最大。
4)B树的查找
基本操作:在B树中找结点,在结点内找关键字。
5)B树的插入
(1)定位:找出插入该关键字的最底层中的某个非叶结点。(B树中的插入关键字一定插入在最底层中的某个非叶结点内)
(2)插入:每个非失败结点的关键字个时速都在区间[m/2-1,m-1]内,
插入后的结点关键字个数小于m,可以直接插入;插入后的结点关键字个数大于m-1,必须对结点进行分裂。
6)B树的删除
(1)删除非终端结点时
若小于k的子树中关键字个数>m/2-1,则找出k的前驱值,并用k的前驱值取代k,再递归删除前驱。
若大于k的子树中关键字个数>m/2-1,则找出k的后继值,并用k的后继值取代k,再递归删除后继。
若前后两个子树中关键字个数均为m/2-1,则直接将两个子节点合并,直接删除k。
(2)删除终端结点时
直接删除关键字。若被删除关键字所在结点的关键字个数>m/2-1,直接删除。
兄弟够借。若被删除关键字所在节点删除前的关键字个数=m/2-1,且与此结点相邻的右(左)兄弟结点的关键字个数>=m/2-1,则调整该结点的兄弟结点及双亲结点,达到平衡。
兄弟不够借。若被删除关键字所在节点删除前的关键字个数=m/2-1,且与此结点相邻的右(左)兄弟结点的关键字个数=m/2-1,则将该结点的兄弟结点及双亲结点中的关键字进行合并。
8、B+树
1)m阶B+树的性质:
(1)每个分支结点最多有m棵子树;
(2)非叶根结点至少有两棵子树,其他每个分支结点至少有m/2棵子树;
(3)结点的子树个数与关键字个数相等;
(4)所有叶结点包含全部关键字及指向相应记录的指针,叶结点中将关键字按大小顺序排列,并且相邻叶结点按大小顺序互相链接起来;
(5)所有分支节点中仅包含它的各个子结点中关键字的最大值及指向其子结点的指针。
8、B树和B+树的区别
1)B+树中,n个关键字的结点只含有n棵子树,即每个关键字对应一颗子树;B树中,n个关键字的结点含有n+1棵子树。
2)B+树中,每个结点的关键字个数n的范围m/2<=n<=m,根结点1<=n<=m;B树中,每个结点的关键字个数n的范围m/2-1<=n<=m-1,根结点1<=n<=m-1。
3)B+树中,叶结点包含信息,非叶结点仅起索引作用,非叶结点中的每个索引项只含有对应子树的最大关键字和指向该子树的指针,不含有该关键字对应记录的存储地址。
4)B+树中,叶结点包含了全部关键字,即在非叶结点中出现的关键字也会出现在叶结点中;B树中,叶结点包含的关键字和其他结点包含的关键字是不重复的。
9、散列表:根据关键字而直接进行访问的数据结构。
散列函数:一个把查找表中的关键字映射陈该关键字对应的地址的函数,记作Hash(key)=Addr。
冲突:散列函数将两个或两个以上的不同关键字映射到同一个地址。
散列表建立了关键字和存储地址之间的一种直接映射关系。
10、常用的散列函数
1)直接定址法
直接取关键字的某个线性函数值为散列地址,散列函数为H(key)=a*key+b,ab为常数。
适合关键字的分布基本连续的情况,不会产生冲突。
2)除留余数法
假定散列表的表长为m,取一个不大于m但最接近或等于m的质数p,散列函数为H(key)=key%p。
3)数字分析法
4)平方取中法
5)折叠法
11、处理冲突的方法
假定选定散列函数H(key),Hi表示发生冲突后第i次探测的散列地址。
1)开放定址法:指可存放新表项的空闲地址既向它的同义词表项开放,又向它的非同义词表项开放。Ni=(H(key)+di)%m,(m表示散列表表长,di为增量序列)。
当某一增量序列确定后,对应处理方法确定,通常有4种:线性探测法、平方探测法、再散列法、伪随机序列法。
2)拉链法(链接法)
12、散列表的查找效率取决于三个因素:散列函数、处理冲突的方法、装填因子。
装填因子:一个表的装满程度。α=表中记录数n/散列表长度m。α,发生冲突的可能性越大。
数据结构(C语言版)---查找的更多相关文章
- 数据结构C语言版 有向图的十字链表存储表示和实现
/*1wangxiaobo@163.com 数据结构C语言版 有向图的十字链表存储表示和实现 P165 编译环境:Dev-C++ 4.9.9.2 */ #include <stdio.h> ...
- c++学习书籍推荐《清华大学计算机系列教材:数据结构(C++语言版)(第3版)》下载
百度云及其他网盘下载地址:点我 编辑推荐 <清华大学计算机系列教材:数据结构(C++语言版)(第3版)>习题解析涵盖验证型.拓展型.反思型.实践型和研究型习题,总计290余道大题.525道 ...
- 数据结构C语言版 表插入排序 静态表
数据结构C语言版 表插入排序.txt两个人吵架,先说对不起的人,并不是认输了,并不是原谅了.他只是比对方更珍惜这份感情./* 数据结构C语言版 表插入排序 算法10.3 P267-P270 编译 ...
- 数据结构C语言版 弗洛伊德算法实现
/* 数据结构C语言版 弗洛伊德算法 P191 编译环境:Dev-C++ 4.9.9.2 */ #include <stdio.h>#include <limits.h> # ...
- 《数据结构-C语言版》(严蔚敏,吴伟民版)课本源码+习题集解析使用说明
<数据结构-C语言版>(严蔚敏,吴伟民版)课本源码+习题集解析使用说明 先附上文档归类目录: 课本源码合辑 链接☛☛☛ <数据结构>课本源码合辑 习题集全解析 链接☛☛☛ ...
- 深入浅出数据结构C语言版(12)——从二分查找到二叉树
在很多有关数据结构和算法的书籍或文章中,作者往往是介绍完了什么是树后就直入主题的谈什么是二叉树balabala的.但我今天决定不按这个套路来.我个人觉得,一个东西或者说一种技术存在总该有一定的道理,不 ...
- 深入浅出数据结构C语言版(5)——链表的操作
上一次我们从什么是表一直讲到了链表该怎么实现的想法上:http://www.cnblogs.com/mm93/p/6574912.html 而这一次我们就要实现所说的承诺,即实现链表应有的操作(至于游 ...
- 【数据结构(C语言版)系列二】 栈
栈和队列是两种重要的线性结构.从数据结构角度看,栈和队列也是线性表,但它们是操作受限的线性表,因此,可称为限定性的数据结构.但从数据类型角度看,它们是和线性表大不相同的两类重要的抽象数据类型. 栈的定 ...
- 深入浅出数据结构C语言版(6)——游标数组及其实现
在前两次博文中,我们由表讲到数组,然后又由数组的缺陷提出了指针式链表(即http://www.cnblogs.com/mm93/p/6576765.html中讲解的带有next指针的链表).但是指针式 ...
- 深入浅出数据结构C语言版(8)——后缀表达式、栈与四则运算计算器
在深入浅出数据结构(7)的末尾,我们提到了栈可以用于实现计算器,并且我们给出了存储表达式的数据结构(结构体及该结构体组成的数组),如下: //SIZE用于多个场合,如栈的大小.表达式数组的大小 #de ...
随机推荐
- Salesforce LWC学习(十五) Async 以及 Picklist 公用方法的实现
本篇参考:salesforce 零基础学习(六十二)获取sObject中类型为Picklist的field values(含record type) https://developer.salesfo ...
- Boxes Packing
Boxes Packing Mishka has got n empty boxes. For every i (1 ≤ i ≤ n), i-th box is a cube with side le ...
- js获取dom节点之 id 获取
在JavaScript中,标准的id选择器调用语法是: document.getElementById('myid').style.width = pc + "%"; 但是,今天发 ...
- Java进行二元操作类型转换
当对两个数值进行二元操作时,先要将两个操作数转换为同一种类型,然后再进行计算. 如果两个操作数中有一个是double类型,另一个操作数就会转换为double类型. 否则,如果其中一个操作数是float ...
- 写一个TODO App学习Flutter本地存储工具Moor
写一个TODO App学习Flutter本地存储工具Moor Flutter的数据库存储, 官方文档: https://flutter.dev/docs/cookbook/persistence/sq ...
- python通过pymysql实现数据库的增删改查
今天实现了python对于数据库的增删改查工作: 具体的每一步的数据库的增删盖茶自己都实验过了. 掌握了基本的数据库操作语言.然后就是对于tuple()的认识. 以及对于查询语句中的:fetchone ...
- 安卓开发学习日记 DAY3——TextView,EditView,ImageView
今天学习了一些控件的使用方法,包括TextView,EditView,ImageView 1.TextView,输出一个文本呗 主要属性有 android:id 标志 android:layout_w ...
- ensp的基础路由命令,接口,下一跳的配置,入门必备
关于ensp入门事情,第一件事当是安装必备三件套:而后,应该是接触路由和PC机了,最烦人满屏代码,眼花缭乱: 今天写一篇零基础接触ensp的首次操作,PC-路由-路由-PC的互通实验: 实验要拉出两台 ...
- redis 非关系型数据库
redis 类型,数据存在磁盘里面,所以存储速度比较快,其他数据类型还是存储在数据库所以比较慢些 链接redis数据库: r=redis.Redis(host="%%%%%%%", ...
- python3(三十一)metaclass
""" """ __author__ = 'shaozhiqi' # 动态语言和静态语言最大的不同,就是函数和类的定义,不是编译时定义的,而 ...