五一清北学堂培训之数据结构(Day 1&Day 2)
Day 1
前置知识:
- 二进制
2.基本语法
3.时间复杂度
正片
1.枚举
洛谷P1046陶陶摘苹果 入门题没什么好说的
判断素数:从2枚举到sqrt(n),若出现n的因子,则n是合数
因为数据范围比较小,所以直接欧拉筛,再判定在l~r区间内的数
代码......被我吃了
好题*1
显然暴力枚举dfs不现实。
所以我们要想点办法(废话)
用ai来表示第i个数是否选中,不选是0,选是1
把每个ai写下来。拿样例的第一个举个例子,就是1110(3选,7选,12选,19不选)
我们发现,写下来后就是一个二进制数,这样组成的每一个二进制数就能代表一种状态,而且不会重复表示。
这样我们枚举状态,就是在枚举000……0(n个0)到111……1(n个1)的所有二进制数
为了方便,我们把它转为十进制数进行枚举,上限就是2^n。
代码(咕咕咕~~~~)
#include<iostream>
#include<cstdio>
#include<cstring>
#include<algorithm>
#include<cmath>
using namespace std;
int n,m,a[],ans;
int check(int x)
{if(x<=)return ;//注意特判
for(int i=;i<=sqrt(x);i++)
if(x%i==)return ;
return ;
}
void make_ans()
{ for(int i=;i<(<<n);i++)
{
int tmp=,sum=;
for(int j=;j<n;j++)
{
if((<<j)&i)//2^k的二进制表示只有第k位是1,其余是0,看枚举的二进制数上哪一位是1
{
tmp++;
sum+=a[j];//就选那一位对应的数
}
}
if(tmp==m)//如果选够m位就判断sum
{ans+=check(sum);
}
}
}
int main()
{
scanf("%d%d",&n,&m);
for(int i=;i<=n;i++)
scanf("%d",&a[i]);
make_ans();
printf("%d",ans);
}
练习:求L到R中有多少数既是回文数又是素数
1<=L<=R<=10^7
显然枚举素数,再判回文数的话会炸
那我们不妨换个东西枚举,我们枚举回文数。
对于回文数来说,正着读和倒着读都一样,并且只要知道了一半,另一半也就知道了。所以我们直接枚举回文数的一半,再拼出另一半,看是否是素数。对于偶数位的回文数来说,要枚举k/2位(k为位数),奇数位回文数要枚举k/2+1位,而是偶数位数的回文数一定是11的倍数,不用管。
代码如下(本人口胡的....应该是对的吧,要是不对欢迎纠错)
#include<iostream>
#include<cstdio>
#include<cstring>
#include<algorithm>
#include<cmath>
using namespace std;
int n,m,a[],ans;
int l,r;
int make_size(int x)//统计位数
{int an=;
while(x)
{an++;
x/=;
}
return an;
}
int ksm(int x,int b)//快速幂的板子(待会分治要讲)
{int r=;
while(b)
{if(b&)r*=x;
x*=x;
b/=;
}
return r;
}
int huiwen(int x)//制作回文数
{int a[],y,z=;
memset(a,-,sizeof(a));
int m=x;
while(m)
{y=m%;
m/=;
a[++z]=y;
}//把原数的每一位分出来
for(int i=;i<=;i++)
{if(a[i]>=)
{x*=;//进行复制
x+=a[i];
}
}
return x;
}
bool check(int x)//判素数
{if(x<=)return ;
for(int i=;i<=sqrt(x);i++)
if(x%i==)return ;
return ;
}
int main()
{ scanf("%d%d",&l,&r);
int size_l;
size_l=make_size(l)/;//因为是枚举回文数的一半再复制,所以从l位数的一半开始枚举(这里计算l的位数)
int kk=ksm(,size_l);//初始的回文数的一半
for(int i=kk;huiwen(i)<=r;i++)//制作的回文数不大于r才能继续循环
{int m=huiwen(i);//制作回文数
if(check(m))ans++;//check判素数(也可以预处理)(我懒)
}
printf("%d",ans);
}
枚举的优缺点
所以我们枚举时最好利用一些性质进行枚举
2.搜索
搜索本质上是一种枚举,但是可以表达一些枚举不方便表述的状态
(接下来的东西会越来越难,so有些太难的就不写代码了)
搜索分为深搜和广搜
深搜
也就是dfs(大法师)
举个例子
有多组数据
看的出来,深搜复杂度玄学,所以深搜剪枝是很重要的。
虽然不是澡堂讲的,但我觉得写一下还是有必要的。
大法师dfs剪枝小技巧:
1.在某一顺序会造成很多不明错误时,不妨换一下搜索顺序。
2.如果有几种情况是等效的,那只需对其中一种情况进行搜索
3.及时对当前状态进行检查,如果到了边界,就立即回溯,不要继续搜下去(能省不少时间),也叫上下界剪枝
4.在最优化问题搜索中,如果当前花费超过已找到的最优解,就立即返回。因为继续搜下去,花费一点比最优解大。
5.记忆化搜索
不难看出,在上面的代码中,数据一多就会TLE。这是因为进行重复计算浪费了大量时间。解决办法就是在第一次计算时,将算出的每个f(n)记录下来,搜索到这一项时直接返回,不再进行递归。
#include<iostream>
#include<cstdio>
#include<cstring>
#include<algorithm>
#include<cmath>
using namespace std;
long long n,f[],t;
long long ff(int n)
{ if(n==)f[n]=;
if(n==)f[n]=;
if(f[n])return f[n];
else
{f[n]=ff(n-)+ff(n-);
return f[n];
}
}
int main()
{
scanf("%lld",&t);
for(long long i=;i<=t;i++)
{scanf("%lld",&n);
printf("%lld",ff(n));
}
}
输出一种方案
如果有多组解,按字典序输出
这道题看起来让人质壁分离。
我们要用dfs,因为用dfs空间会炸掉。
因为要字典序,所以我们遵循先h再o的顺序搜就好了(代码什么的真好吃)
虽然fz说鬼畜的题用广搜,but这里我们用深搜,
why?广搜你怎么存状态???
我们在正方形里,从低到高,从做往右枚举要填进来的正方形(就是维护正方形的下轮廓)
随便举个例子
图中的数字表示枚举的点的顺序
有一个小优化:不重复选用边长相同的小正方形
广搜
广搜主要注意状态的确定。
广搜主要应用之一:迷宫(以下题目100%只说思路,没有代码233)
前面说过,广搜的要点是状态的确定。这里的状态是每个格子的填法。我们可以将每一种填法对应一个数,再用vis[i]记录是否出现过当前状态。
如果有多个数据,就从结果开始搜,搜到初始状态。
代码太难惹2333以后再说qwq。
这里可以经过障碍物。在正常的情况下,障碍物是不能经过的。但这里不正常,所以我们记录状态也不能用正常的记录方式(记录当前步数),而是要记录当前经过的障碍物数。显然,当前经过的障碍物数越小越好,所以我们先扩展当前经过障碍物数量最小的点。而一直遵循这个原则,我们记录的点就只会出现k和k+1这两种状态(k为当前经过障碍物数)。所以我们只要维护两个队列(k和k+1就行了),每次扩展点的时候,扩展同一层的点。
别看题目描述的乱七八糟,其实它就是个暴力。
用四维数组记录人和箱子的位置(人的位置对箱子的方向有影响)然后暴力就是了。
记住,鬼畜的题一般都用广搜,例如下一道
数据保证只有三个固体块(不多也不少)
够鬼畜吧。(当年华容道这游戏虐的我不成人样233)
因为这里固体块不会旋转。所以我们可以用每个固体块的任意一小块来代替这个固体块。在这里我们用每个固体块左上角的小块来代替。
同时以一开始覆盖所以固体块的大矩形为“底”,建立坐标系。
例如:
这样就可以方便的表示每个固体块了。
但因为每种状态是由三个固体块的位置构成,所以要用6维数组,记录每个固体块左上角的坐标。
维度太大,试着降维。
那就固定一个固体块的左上角,使其永远是(0,0),如果该固体块要移动,那就让它旁边的固体块做相对运动。
这样固定下来的固体块的位置就不用讨论了。6维-->4维
再进行广搜,对每个固体块该怎么移动就怎么移动,以及判断一撮balabalabala...........................
这里我们就不管期望了。
多源多汇最短路详情请见明天。
bfs另一个用途:
图论
存储:1.邻接矩阵(空间:n^2)(便于加删)
2邻接表(vector)(访问较快,删除麻烦)(较慢)
vector:存储
弹掉最后一个
计算长度
(还是前向星适合我)
贪心:
每一步选取当前最优。
当不确定时,把多个贪心策略拼一起可以骗分
按照牛奶单价排序,选取即可
让体积最大的和最小的放一个箱子里,如果没有能配成对的就单着
把式子化简一下:
Ai*j-Ai+Bi*n-Bi*j=j*(Ai-Bi)+(n*Bi-Ai)
红字为常数,不用管,然后对(Ai-Bi)排序
这里式子中的Ai不是最大出水量,是0到最大出水量之间的一个数
依旧是化简一下式子:
Σ(Ai)*T=Σ(Ai*ti)=Σ(Ai*T)
ΣAi(ti-T)=0
这里肯定会有
1.ti-T>0 2.ti-T<0
如果得到的水最终的温度是T,就得让这两边的水互相“中和”。又要让最终的总水量尽可能大,所以少的那一边必定全部选上,多的那一边剩余的就不选了
//代码 from fz
#include<cstdio>
#include<algorithm>
#include<cstring> #define N 300005 using namespace std; int a[N],t[N],i,j,m,n,p,k,id[N],ID[N],sum[N],T; double ans; int cmp(int x,int y)
{
return sum[x]<sum[y];
} int main()
{
scanf("%d%d",&n,&T);
for (i=;i<=n;++i)
{
scanf("%d",&a[i]);
}
for (i=;i<=n;++i) scanf("%d",&t[i]);
for (i=;i<=n;++i)
{
if (t[i]==T) ans+=a[i];
else if (t[i]<T) id[++id[]]=i,sum[i]=T-t[i];
else ID[++ID[]]=i,sum[i]=t[i]-T;
}
sort(id+,id+id[]+,cmp);
sort(ID+,ID+ID[]+,cmp);
long long suma=,sumb=;
for (i=;i<=id[];++i)
suma+=1ll*sum[id[i]]*a[id[i]];
for (i=;i<=ID[];++i)
sumb+=1ll*sum[ID[i]]*a[ID[i]];
if (suma<sumb)
{
swap(suma,sumb);
for (i=;i<=n;++i) swap(ID[i],id[i]);
}
for (i=;i<=ID[];++i) ans+=a[ID[i]];
for (i=;i<=id[];++i)
if (1ll*sum[id[i]]*a[id[i]]>=sumb)
{
ans+=.*sumb/sum[id[i]];
break;
}
else
{
ans+=a[id[i]];
sumb-=1ll*sum[id[i]]*a[id[i]];
}
printf("%.10lf\n",ans);
}
作业问题:
有n项作业,第i项作业需要ai天完成,而某人希望在第bi天完成这项作业。设ci为第i项作业写完的那一天,则ci-bi就是第i项作业的延迟调度,求最小的延迟调度之和。
我们用策略3.
反例?忘了(@wwww@)
二分
最大距离最小:
设最大距离为mid,看是否可行。
判是否可行:尽量远
mid>=k时,合法,mid<=t时,不合法(k,t为某个数)
二分k,t(最开始t=最大上界(1e9))
这道题看起来是贪心,然而它是二分
总结:用二分把问题变为判定性问题
三分
三分用来计算这种东西的峰值
分治
复杂度:只和k的二进制数位有关
归并排序
|---------------------------------------------------------------------------|
->|-------------------------------------| |----------------------------------|
->|------------------||----------------| |---------------||-----------------|
就类似这样(这是分)
for example:
3 8 6 7
选出3,第一个的左指针右移
-->选出6,第二个的左指针右移
-->如此循环
For example:
15
/ | \
7 1 7
/ | \ / | \
3 1 3 3 1 3
/ | \ / | \ / | \ / | \
1 1 1 1 1 1 1 1 1 1 1 1
对于每个编号i来说,分治查看i在那棵子树里。
举个例子:i=10;
将上面这棵树从中间分开,中间编号i=8,显然10>8,所以编号为10的元素在右边这棵子树中,再查看下面(图1)这颗树(原图中右边的子树),i此时变为10-8=2,发现i在左边的这棵树(图二)中的第二个元素,是1.
图1 图2
旷世好题之平面最近点对
欧几里得距离就是sqrt((x1-x2)^2+(y1-y2)^2)(就是两点间距离公式)
Day 2
二叉搜索树:
这个比较简单,只需要在每次加入时比较加入的数和当前最大的数,然后更新就行了。
这里扯到了删除,所以就没有上一个题那么简单了。
这时候我们用到了二叉搜索树。
什么是二叉搜索树?
for example
这就是一棵二叉搜索树。
二叉搜索树性质:
对于每一个结点来说,它的左子树严格小于它,右子树严格大于它(这里不讨论有相同数的情况)
我们要利用二叉搜索树来完成这个操作。
因为每个结点左边的值都比右边小,所以要求最小值,就找左儿子,如果没有左儿子的话,那这个点就是最小值。
int findmin()
{
intx=root;
while(ls[x])x=ls[x];//只要有左儿子,就继续走
return key[x];//返回最小值(权值)
}
插入:
我们既要插入,又要维护整棵树的形态,所以我们从根节点开始插入,与当前结点比较。我们用key[root]表示当前点的权值,root为当前点,x为要加入的点的权值。我们比较key[root]和x.
如果key[root]<x,x那就说明x在root的右边,与root的右儿子比较,如果key[root]>x,就将x与root的左儿子比较,最终完成插入
下面的root表示根节点
void put(int x)
{ sum[++tot]=x;//用tot表示二叉树结点的个数
size[tot]=1;
if(!root) root=tot//如果没有结点,就让它有结点
else
{
int now=root;//从根开始
while(true)
{++size[now];//size[i]表示点i的度(也就是i下面的点数+1)
if(sum[now]>sum[tot])//判断要插入的点和当前点
{
if(!ls[now])//如果当前点没有左儿子
{
ls[now]=tot;fa[tot]=now;//插入,插完就跑
break;
}
else now=ls[now]//如果有左儿子,就继续比较(按左儿子找)
}
else
{if(!rs[now])
{rs[now]=tot;fa[tot]=now;
break;
}
else now=rs[now];
}
}
}
}
fz鬼才缩进!
删除:
step1.定位结点
从当前点开始,就像刚才插入一样寻找。
int find(int x)
{
int now=root;
while(key[now]!=x)
if(key[now]<x)x=rs[now];//如果当前点的权值比x小,说明x在右子树里
else x=ls[now];//否则就在左子树里
return now;
}
step 2.删除:
我们这里不选择把点置零。(会造成各种奇奇怪怪的困难)
我们考虑点x的儿子的情况。
如果没有儿子,就直接删了
如果有一个儿子,直接让它的儿子认它的父亲为父,然后删掉。
如果有两个儿子,就找到这个点右子树中权值最小的结点y,作为x的后继。然后把y和x的父亲暴力一拼,删除x.就像下图
int find(int x)//查询值为x的数的节点编号
{
int now=root;
while (sum[now]!=x&&now)
if (sum[now]<x) now=rs[now]; else now=ls[now];
return now;
}
void del(int x)//删除权值为x的点
{
int k=find(x),t=fa[k];//找到x的父节点
if(!ls[k]&&!rs[k])//如果x既没有左儿子,又没有右儿子
{
if(ls[t]==k)ls[t]=; else rs[t]=;//x的父亲就没有儿子了
for(int i=k;i;i=fa[i]) size[i]--;//从x点开始,把它的每个祖宗的度-1
}
else if
(!ls[k]||!rs[k])//只有一个儿子
{
int child=ls[k]+rs[k]//把x的儿子的编号弄出来
if(ls[k])ls[t]=child; else rs[t]=child;
}
else
{int y=rs[k];while(ls[y])y=ls[y];//找后继
if(rs[k]==y)//如果后继是x的右儿子
{if(ls[t]==k)ls[t]=y;else rs[t]=y;
fa[y]=t;
ls[y]=ls[k];
fa[ls[k]]=y;
for(int i=k;i;i=fa[i])size[i]--;
size[y]=size[ls[y]]+size[rs[y]];
}
else//最可怕的情况
{ for(int i=fa[y];i;i=fa[i]) size[i]--;
int tt=fa[y];
if(ls[tt]==y)
{ls[tt]=rs[y];//如果y是它爹的左儿子,那就让y唯一的儿子(右儿子)代替y原本的位置(y要提上去)
fa[rs[y]]=tt;
}
else
{rs[tt]=rs[y];
fa[rs[y]]=tt;
}
if(ls[t]==x)//再提x
{ls[t]=y;//如果x是它爹的左儿子,就更新为左儿子为y
fa[y]=t;
ls[y]=ls[k];
rs[y]=rs[k];
}
else
{rs[t]=y;//按右儿子更新
fa[r]=t;
ls[y]=ls[k];
rs[y]=rs[k];
}
size[y]=size[ls[y]]+size[rs[y]]+;
}
}
}
小扩展:
求许多数中第k大的数。
看起来一个sort可以解决的样子
来我们讨论下用二叉搜索树怎么解决
前面我们提到了size[i],我们用它表示i这个节点子树里节点的个数。
我们从根开始走,如果右子树的size>=k,说明第k大值在右子树里。反之就在左子树里。当然,如果右子树的size+1=k,就说明当前这个点就是最大值。因为右子树的size+1就是当前点的size。这样就可以递归求解了。在每次递归到下一层时,如果到了左子树,要注意把当前的k减去右子树的size,然后-1。
int find_kth(int now,int k)
{
if(size[rs[now]]>=k)return find_kth(rs[now],k);//分别对应上面三种情况
if(size[rs[now]]+==k)return key[now];
return find_kth(ls[now],k-size[now]-);
}
对于正常插入和删除的size维护可以总结为一下几点:
插入:沿路增加。
删除:1.size[fa[i]-1](无儿子)
2.只有右儿子:沿路的父亲节点size-1
3.左右儿子都有:从y往上一直到x的父亲,一路-1.(具体代码中都有)
二叉搜索树排序:
这里我们要用到二叉搜索树的性质。
对于二叉搜索树来说,每个结点的左子树严格小于它,即左子树中不会有权值比它大的点,而右子树严格大于它,即不会有权值比它小的点。这样我们做一次中序遍历就可以得到一个排序了。
中序遍历:遵循左中右原则。
举个例子:
箭头为遍历顺序,点上的数字为输出的顺序
深搜即可解决
int dfs(int now)
{
if(ls[now])dfs(ls[now])
printf("%d",key[now]);
if(rs[now]) dfs(rs[now]);
}
就像第二个例子,画出来的树是成链的
这种数据遍历起来复杂度就有点崩溃(复杂度为树的高度)
二叉堆
我们可以手写,也可以用系统堆(个人感觉还是优先队列好用qwq)
这里注意一下堆的插入是从下一路向上比,而二叉搜索树是从根节点一路往下比。
修改一个点的权值:
咦,为什么没有删除最小值?
删除最小值只要把一个权值改到无穷大就能解决辣
比较简单的是把一个权值变小。
那只要把这个点像插入一样向上动就行了。
权值变小:上浮(就是从下往上比)
权值变大:下沉(就是从上往下比)
定位问题:
寻找权值为x的点的编号;
假设权值两两不同,再记录一下某个权值现在哪个位置。(用辅助数组pos[权值]=位置)
在交换权值的时候顺便交换位置信息。
int find(int x)
{
return pos[x];
}
void up(int now)
{
while(now&&a[now]<a[now/])
{swap(a[now],a[now/];
swap(pos[now],pos[now/]); //注意pos要跟着一起变
now/=;
}
}
void down(int now)
{
while(now*<=n)
{if(a[now]>a[now*])
{swap(a[now],a[now*];
swap(pos[now],pos[now*]);
now*=;
}
else
{
if (a[now]<=a[now*]&&a[now]<=a[now*+]) break;
if (a[now*]<a[now*+])
{ swap(a[now],a[now*]);
swap(pos[now],pos[now*]);
now*=;
}
else
{swap(a[now],a[now*+]);
swap(pos[now],pos[now*+]);
now=now*+;
}
}
}
//以上是变换
删除:先赋值为inf,再下沉(元素会特别多)
可以把最后一个结点放到根上,然后再下沉(与此同时n - -)
应用:
堆排序
把数全部插进去,每次询问最小值,然后把根删掉就行了.
看道题:
丑数
丑数指的是质因子中仅包含2,3,5,7的数,最小的丑数是1,求前k个丑数。
K ≤ 6000
看起来好像可以打表,但这样不优雅。
ps:打表小技巧:把要打的数拼尽全力转为100进制用字符串存,省时间省空间费脑子。
(也可以打一个巨长的表卡编译器10min)
好了说正经的。
我们选中x后,接下来我们要选2x,3x,5x,7x,我们把这些数塞进堆里,每次取的时候和上一次取出来的数比较,如果不同,就输出,并且计数器+1,如果相同,就不要。因为堆是有序的,而且我们维护的是一个小根堆。
一些方便的东西:
1.queue
queue里面有一个叫priority_queue,也就是所说的优先队列。这是一个大根堆,不过我们可以做点什么让它变成小根堆。
例如这样
函数:
q.push() 插入
q.top() 返回
q.pop() 弹掉
q.clear() 清空
2.set(高级的二叉搜索树)
st.insert( x )插入(不会插入两个相同的东西)
st.erase( x )删除
st.find( x )看是否存在某个数
st.lower/upper bound():
lower_bound( x ):找到第一个大于等于x的数的地址。
upper_bound( x ):找到第一大于x的数的地址
st.begin()/st.end()取最小/最大值后面的一部分
ser<int>::iterator it=st.lower_bound(x)
上面的it可以进行:it++ or i--(其他操作不行)
set可维护有序数组(可以代替系统堆(可能有点慢233,不过操作多))
区间RMQ问题:
给出一个长度为N的序列,我们会在区间上干的什么(比如单点加(给一个点加),区间加(给一个区间内的所有点加),区间覆盖),并且询问一些区间有关的信息(区间的和,区间的最大值)等。
例一:
给出一个序列,每次询问区间最大值.
N ≤ 100000,Q ≤ 1000000.
我们先抛开最大值不谈,如果这个题要求和的话,只用求出前缀和就好,因为[l,r]的权值之和等于[1,r]-[1,l-1].
那我们回到这个题,是否可以模拟求和的思路,通过求出类似前缀和的东西,来求出区间的的最大值呢? 当然可以。这道题所有的数给定后就不会动了,所以这是个静态的。并且是可重复计算(可重复计算特指求最大值或最小值),我们就可以用st表。
st表思想:
先求出每个[i,i+2^k)的最值,然后找出两个区间包住询问的区间,这两个区间的最值就是答案。
我们注意到这样的区间总数是nlogn的(i有n个,k有logn个)
这个题里,我们不妨设f[i][j]是[i,i+2^j)的最小值。
首先,f[i][0]都是i.
其次,f[i][j]=min(f[i][j-1],f[i+j-1][j]);下面这个图就可以解释一下
|------------| |------------|
i i+2^(j-1) i+2^j
知道了这些,就可以处理整个st表了。
那如何寻找那两个区间?
先找最大的k满足2^k<=r-l+1(r-l+1是整个区间的长度)
我们找到这样的k,那[l,l+2^k),[r-2^k+1,r+1)这两个区间自然就能包住整个[l,r),而且不会出现[l,r]之外的部分。
|--------------------| 区间[l,r]
|---------------| 区间[l,l+2^k)
|----------------|区间[r-2^k+1,r+1)
这是图示
找到这两个区间后,f[l][k],f[l+2^k+1][r]中较小的一个就是答案。这样每次询问时只需要找区间,复杂度o(1)
再来看一道
给出一个序列,支持对某个点的权值修改,或者询问某个区间的最大值.
N,Q ≤ 100000.
这道题和刚才那道题的区别就在于这里每个点的权值是有可能变的,所以就不再是静态的,而是动态的。那我们还能不能继续用st表做呢?试一下。
比如改5这个点.
j = 0 改了一个位置,嗯,完美.
j = 1 改了两个位置4,5,稳.
j = 2 改了四个位置2,3,4,5,还行
j = 3,emmmmmm好像不太妙。
我们注意到当j往上走的时候,要改的区间个数是这个点的编号。j是指2^j的那个j.
看来现在修改一侧就要修改O(N)个点
看起来会炸
既然st表不靠谱,那咋办?
那我们肯定就不能用静态求最值的东西了。我们换一个动态的。
线段树
本质是一棵不会改变形态的二叉树.
树上的每个节点对应于一个区间[a,b](也称线段),a,b通常为整数
同一层的节点所代表的区间,相互不会重叠
同一层节点所代表的区间,加起来是个连续的区间
对于每一个非叶结点所表示的结点[a,b],其左儿子表示的区间为[a,(a+b)/2],右儿子表示的区间为[(a+b)/2+1,b](除法去尾取整)
就像下面:
这里的从中间开始是指该结点的两个儿子是由它从中间剖开得到的。
这个线段树也演示了一个区间拆分的过程。
区间拆分:
将一个区间[a,b]拆成若干个结点,使这些结点加起来还是区间[a,b],且互不重叠。对于在[a,b]内的一个区间[l,r]来说,如果在区间拆分过程中拆出的结点所代表的区间在[l,r]内,就称这个结点为终止结点。这个拆出来的区间就是终止区间。
和st表有什么区别?
1.st表是静态的,而线段树是可以动态的。
2.st表会有重叠,而线段树不会有重叠。
如何进行区间拆分?
从根节点[1,n]开始,考虑当前节点是[L,R].
如果[L,R]在[a,b]之内,那么它就是一个终止节点.
否则,分别考虑[L,Mid],[Mid + 1,R]与[a,b]是否有交,递归两边继续找终止节点.
哪边有交就往哪走
来我们看几道好题。
一.给一个数的序列A1 ,A2 ,...,An .并且可能多次进行下列两个操作:
1.对序列里面的某个数进行加减
2.询问这个序列里面任意一个连续的子序列A i ,A i+1 ...A j 的和是多少.
希望单个操作能在O(logN)的时间内完成.
通过阅读上下文可知这题要用线段树。
运用线段树,每个区间要记录的是?
ΣAi
对于操作1,我们相当于对[i,i]做了一个区间拆分(最后要拆出来[i,i]),沿路我们找到所有的祖先结点,维护记录的和(每个结点的答案为它的左儿子+它的右儿子)。
对于操作2,我们对给的区间[l,r]做一个区间拆分,将拆分出的每一个终止结点的和累加起来就是答案。(代码什么的先不管了233)
二
给定Q个数A 1 ,...,A Q ,多次进行以下操作:
1.对区间[L,R]中的每个数都加n.
2.求某个区间[L,R]中的和.
Q ≤ 100000
乍一看,好像见过。
哎这不对啊,咋是区间加呢?说好的单点加呢?
区间加,我们就得好好考虑考虑了。暴加一定会炸。
大家都遇到过拖更的现象吧。在这里我们也采用拖更这种想法。先把要加的数用inc记下来,要是询问到这个区间,就加上,不然就不加了,还省时间。在区间增加时,如果要加的区间正好覆盖一个结点(也就是到了终止结点),就增加其inc和sum(这里sum是当前结点的真实值),不再往下走。
回来更新:由左右儿子加和。
拖更思想更新延迟的代码
旷世好题*2
显然这里砖多的令人头疼。咱想想办法给他降一下数量。既然要降砖块的数量,那就不能管砖的面积是多大了。
我们把所有海报端点去重排序最终可以降成4w块
因为海报的端点最多20000个(这里的“端点”是海报的边的横坐标),一定有海报中间的部分跨过好几块砖,我们就把那好几块砖视作一块
那么我们从最底层的海报开始,一张一张往上贴.
对于一个区间[L,R],我们记录的信息是这个区间整体被第几张海报覆盖了,初始值设为−1. (区间拆分and延迟更新)
对于一张包含[L,R]的海报i,我们就只需要把[L,R]里面所有的位置都赋成i就可以了。
注意利用区间分解和延迟更新的方法.
本题中是否会有标记时间冲突的问题?(先来的覆盖后来的)
不会发生,只有可能后来的覆盖先来的。
这样我们结合延迟更新的思想,将每一块的标记向下传。
给出长度为N的序列A,
Q次操作,两种类型:
(1 x v),将A x 改成v.
(2 l r) 询问区间[l,r]中有多少段不同数。例
如2 2 2 3 1 1 4,就是4段。
N,Q ≤ 100000.
这里我们用线段树只记录每个区间的段数一定会出错。为什么呢?线段树区间拆分过后,会把整个大区间分成n个小区间,每个区间的段数都由它的左右儿子的段数相加得来。but真的对吗?
我们摘出来线段树的一部分,这里[1,2]和3的段数都是1,但[1,3]的段数还是1。原因就在于我们合并区间时,会出现[1,2]最右边和3最左边的数相同的情况。为了保证正确性,我们不仅要记录每个区间的段数,还要记录每个区间最左边和最右边的数。
若合并时遇见相同,就段数加起来-1,否则就加起来
树状数组
树状数组:常用来求前缀和。
什么是树状数组?
先看一下这棵树
这样偏了一下,就是树状数组的结构。
对于树状数组C,C[i]=A[i-lowbit[i]]+...........+A[i].
什么是lowbit?简单来说就是i&(-1)
为什么?我也不知道呀
前缀和是指A1+A2+A3+A4+A5+...............+Ak,可以拆成C[k]+C[m]+C[t]+...........
其中m=k-lowbit(k),t=m-lowbit(m)......为什么呢?自己举几个例子就知道了。
#include<cstdio>
#include<algorithm>
#include<cstring>
#include<iostream>
#include<cstring>
#include<string>
#include<cmath>
#include<ctime>
#include<set>
#include<vector>
#include<map>
#include<queue> #define N 300005
#define M 8000005 #define ls (t<<1)
#define rs ((t<<1)|1)
#define mid ((l+r)>>1) #define mk make_pair
#define pb push_back
#define fi first
#define se second using namespace std; int i,j,m,n,p,k,C[N],a[N],b[N]; long long ans; int lowbit(int x)
{
return x&-x;
} void ins(int x,int y)//修改a[x]的值,a[x]+=y;
{
for (;x<=n;x+=lowbit(x)) C[x]+=y; //首先需要修改的区间是以x为右端点的,然后下一个区间是x+lowbit(x),以此类推
} int ask(int x) //查询[1,x]的值
{
int ans=;
for (;x;x-=lowbit(x)) ans+=C[x]; //我们询问的]是[x-lowbit(x)+1,x,然后后面一个区间是以x-lowbit(x)为右端点的,依次类推
return ans;
} int main()
{
scanf("%d",&n);
for (i=;i<=n;++i) scanf("%d",&a[i]),b[++b[]]=a[i];
sort(b+,b+b[]+); b[]=unique(b+,b+b[]+)-(b+);
for (i=;i<=n;++i) a[i]=lower_bound(b+,b+b[]+,a[i])-b;
for (i=;i<=n;++i) ans+=(i-)-ask(a[i]),ins(a[i],);
printf("%lld\n",ans);
}
有什么用呢?
我们可以用前缀和相减的方式来求区间和.询问的次数和n的二进制里1的个数相同.是O(logN).求一个数组A 1 ,A 2 ,...,A n 的逆序对数.n ≤ 100000,|A i | ≤ 10 9 .
我们将A 1 ,...,A n 按照大小关系变成1...n.这样数字的大小范围在[1,n]中.(就是离散化)
维护一个数组B i ,表示现在有多少个数的大小正好是i.
从左往右扫描每个数,对于A i ,累加B A i +1 ...B n 的和,同时将B A i 加1。
时间复杂度为O(N logN).
LCA
在一棵有根树中,树上两点x,y的LCA指的是x,y向根方向遇到到第一个相同的点。
比如:这个图中的两个蓝色的结点的LCA就是根结点。
求法:
我们记每一个点到根的距离为deep x .注意到x,y之间的路径长度就是deep x + deep y − 2 * deep LCA。两个点到根路径一定是前面一段不一样,后面都一样.注意到LCA的深度一定比x,y都要小.利用deep,把比较深的点往父亲跳一格,直到x,y跳到同一个点上. 这样做复杂度是O(len).(每个点跳到公共祖先上)
考虑一些静态的预处理操作.像ST表一样,设fa (i,j) 为i号点的第2^ j 个父亲。
就像这个图演示的一样。
思想:st表
利用类似快速幂的想法.(二分)
每次跳2的整次幂,一共跳log次.
首先不放假设deep x > deep y .为了后续处理起来方便,我们先把x跳到和y一样深度的地方.
如果x和y已经相同了,就直接退出.否则,由于x和y到LCA的距离相同,倒着枚举步长,如果x,y的
第2 ^j 个父亲不同,就跳上去.这样,最后两个点都会跳到离LCA距离为1的地方,在跳一步就行了.
时间复杂度O(N logN).
LCA在图论里会发挥很大的作用
倍增
我们之前讲了分治,就是把一个大的东西分成小的,解决每个小的。而倍增就是反过来,从小的翻成大的。
时间复杂度O(nlogn)-O(logn)O(n logn)
并查集
在基础里我们讲到的优化是路径压缩,这里写出所有的优化
优化:
- 在寻找一个点的顶点时,把这个点的父亲改为其顶点。(路径压缩)(对找爹的优化)
- 按秩合并。(对合并的优化)
对每个顶点,再多记录一个当前整个结构中最深的点到根的深度deep x .
注意到两个顶点合并时,如果把比较浅的点接到比较深的节点上.
如果两个点深度不同,那么新的深度是原来较深的一个.
只有当两个点深度相同时,新的深度是原来的深度+1.
注意到一个深度为x的顶点下面至少有2 x 个点,所以x至多为logN.
那么在暴力向上走的时候,要访问的节点至多只有log个.
(结合路径压缩复杂度会特别低(不过可能数组会有点问题))
(建议结合暴力找爹)
But路径压缩比按秩合并优秀。不过路径压缩复杂度不严格。按秩合并复杂度严格o(log n)
按秩合并:
void Merge(int x,int y)
{
x=get(x); y=get(y);// 使用的是最暴力的get
if (deep[x]<deep[y]) fa[x]=y;
else if (deep[x]>deep[y]) fa[y]=x;
else deep[x]++,fa[y]=x;
}
例题1:
有N个变量,M条语句,每条语句为x i = x j ,或者x i <> x j ,询问这M条语句是否都有可能成立.
N ≤ 10 9 ,M ≤ 100000.
我们先离散化处理出可能出现的变量的大小关系,并把大小相同的变量并到一个集合里。如果同一个变量被并到了两个不同的集合里,就说明不合法。
例题2:
有n个学生,编号0到n − 1, 以及m个团体,0 < n ≤ 30000,0 ≤ m ≤ 500).一个学生可以属于多个团体,也可以不属于任何团体.一个学生疑似疑似患病,则它所属的整个团体都疑似患病。已知0号学生疑似患病,以及每个团体都由哪些学生构成,求一共多少个学生疑似患病.
我们把属于同一个团体的学生并起来,再把患病的学生并起来,最后看和0在同一集合里的学生人数。
好题++:
最后一句要联系更新延迟思想,先打上标记,等到询问的时候再加上个数。
当然也可以这样做:
这样相当于在找根的过程中,把根上的标记拿了下来。
好题++:
有木有很眼熟?
但这里改了一下,每个变量只有0,1两种取值。
举个例子:ai≠aj,aj≠ak,ak≠ai在这里是不成立的,而在刚才的那道题里就是成立的。
所以应该怎么做呢?我们注意到这里的变量非0即1.我们把一个点分成x和x',如果x是0,那x'就是1,反之x'是0.将x和y比较,如果x=y,那么x向y建边,x'向y'建边。反之x向y'建边,x'向y建边。最后查询x和x'的关系,如果在同一集合里,就是不合法的。
五一清北学堂培训之数据结构(Day 1&Day 2)的更多相关文章
- 五一清北学堂培训之Day 3之DP
今天又是长者给我们讲小学题目的一天 长者的讲台上又是布满了冰红茶的一天 ---------------------------------------------------------------- ...
- 7月清北学堂培训 Day 3
今天是丁明朔老师的讲授~ 数据结构 绪论 下面是天天见的: 栈,队列: 堆: 并查集: 树状数组: 线段树: 平衡树: 下面是不常见的: 主席树: 树链剖分: 树套树: 下面是清北学堂课程表里的: S ...
- 10月清北学堂培训 Day 2
今天是杨溢鑫老师的讲授~ T1 物理题,不多说(其实是我物理不好qwq),注意考虑所有的情况,再就是公式要推对! #include<bits/stdc++.h> using namespa ...
- 8月清北学堂培训 Day1
今天是赵和旭老师的讲授~ 动态规划 动态规划的基本思想 利用最优化原理把多阶段过程转化为一系列单阶段问题,利用各阶段之间的关系,逐个求解. 更具体的,假设我们可以计算出小问题的最优解,那么我们凭借此可 ...
- 8月清北学堂培训 Day4
今天上午是赵和旭老师的讲授~ 概率与期望 dp 概率 某个事件 A 发生的可能性的大小,称之为事件 A 的概率,记作 P ( A ) . 假设某事的所有可能结果有 n 种,每种结果都是等概率,事件 A ...
- 8月清北学堂培训 Day2
今天是赵和旭老师的讲授~ 背包 dp 模型 背包 dp 一般是给出一些“物品”,每个物品具有一些价值参数和花费参数,要求 在满足花费限制下最大化价值或者方案数. 最简单几种类型以及模型: 0/1背包: ...
- 7月清北学堂培训 Day 5
今天是钟皓曦老师的讲授~ 动态规划 动态规划的三种实现方法: 1.递推: 2.递归: 3.记忆化: 举个例子: 斐波那契数列:0,1,1,2,3,5,8…… Fn = Fn-1 + Fn-2 1.我们 ...
- 2017 五一 清北学堂 Day1模拟考试结题报告
预计分数:100+50+50 实际分数:5+50+100 =.= 多重背包 (backpack.cpp/c/pas) (1s/256M) 题目描述 提供一个背包,它最多能负载重量为W的物品. 现在给出 ...
- 10月清北学堂培训 Day 7
今天是黄致焕老师的讲授~ 历年真题选讲 NOIP 2012 开车旅行 小 A 和小 B 决定外出旅行,他们将想去的城市从 1 到 n 编号,且编号较小的城市在编号较大的城市的西边.记城市 i 的海拔高 ...
随机推荐
- [11期]绕过安全狗、云锁等各大WAF注入,上传深入自动化Bypass攻击
CDN 负载均衡.内容分发 解析漏洞一般在服务层 二进制,溢出,提权在系统层 渗透测试就是以上全部层 协议未正确解析 GET改POST 这叫参数污染 cook ...
- linux eclipse 下出现undefined reference ***,在使用boost库时出现的问题
直接在eclipse下添加boost_system就可以了,这个文件有可能在库中找不到,或者名字不一样,直接使用这个名字就可以了,在setting 下
- Java相关面试题总结+答案(九)
[MySQL] 164. 数据库的三范式是什么? 第一范式:强调的是列的原子性,即数据库表的每一列都是不可分割的原子数据项. 第二范式:属性完全依赖于主键(满足第一范式的前提下),即任意一个字段只依赖 ...
- SpringBoot内嵌数据库的使用(H2)
配置数据源(DataSource) Java的javax.sql.DataSource接口提供了一个标准的使用数据库连接的方法. 传统做法是, 一个DataSource使用一个URL以及相应的证书去构 ...
- 使用MySQL Workbench进行数据库设计——MySQL Workbench使用方法总结
本文出自[我是干勾鱼的博客] 转自:https://blog.csdn.net/dongdong9223/article/details/48318877 1 创建Model(设计ER图) 使用wor ...
- javascript基础总汇
## javaScript是什么:1.JavaScript 运行在客户端(浏览器)的编程语言2.用来给HTML网页增加动态功能3.用来给HTML网页增加动态功能.4.Netscape在最初将其脚本语言 ...
- 提升JAVA代码的好“味道”
让代码性能更高 需要 Map 的主键和取值时,应该迭代 entrySet() 当循环中只需要 Map 的主键时,迭代 keySet() 是正确的.但是,当需要主键和取值时,迭代 entrySet() ...
- mysql安装,卸载; 库和表的基础操作
数据库 """ 1.什么是数据库:管理数据的系统 - 安装某种管理数据的系统 - 管理的对象本质是文件 2.存储数据的位置:内存.硬盘 3.什么是系统:运行在硬件基础上 ...
- FCKEditor报java.lang.NullPointerException
1.需要在 加value=“ ” <FCK:editor instanceName="replycontent" basePath="/fckeditor" ...
- Linux性能优化从入门到实战:07 CPU篇:CPU性能优化方法
性能优化方法论 动手优化性能之前,需要明确以下三个问题: (1)如何评估性能优化的效果? 确定性能的量化指标.测试优化前的性能指标.测试优化后的性能指标. 量化指标的选择.至少要从应用程序 ...