五一清北学堂培训之数据结构（Day 1&Day 2）

Day 1

前置知识：

二进制

2.基本语法

3.时间复杂度

正片

1.枚举

洛谷P1046陶陶摘苹果入门题没什么好说的

判断素数：从2枚举到sqrt(n),若出现n的因子，则n是合数

因为数据范围比较小，所以直接欧拉筛，再判定在l~r区间内的数

代码......被我吃了

好题*1

显然暴力枚举dfs不现实。

所以我们要想点办法（废话）

用ai来表示第i个数是否选中，不选是0，选是1

把每个ai写下来。拿样例的第一个举个例子，就是1110(3选，7选，12选，19不选)

我们发现，写下来后就是一个二进制数，这样组成的每一个二进制数就能代表一种状态，而且不会重复表示。

这样我们枚举状态，就是在枚举000……0（n个0）到111……1（n个1）的所有二进制数

为了方便，我们把它转为十进制数进行枚举，上限就是2^n。

代码（咕咕咕~~~~）

#include<iostream>

#include<cstdio>

#include<cstring>

#include<algorithm>

#include<cmath>

using namespace std;

int n,m,a[],ans;

int check(int x)

{if(x<=)return ;//注意特判

 for(int i=;i<=sqrt(x);i++)

  if(x%i==)return ;

 return ;

}

void make_ans()

{  for(int i=;i<(<<n);i++)

   {

        int tmp=,sum=;

         for(int j=;j<n;j++)

         {

             if((<<j)&i)//2^k的二进制表示只有第k位是1，其余是0，看枚举的二进制数上哪一位是1

             {

                 tmp++;

                 sum+=a[j];//就选那一位对应的数

        }

      }

      if(tmp==m)//如果选够m位就判断sum

      {ans+=check(sum);

      }

   }

}

int main()

{

    scanf("%d%d",&n,&m);

    for(int i=;i<=n;i++)

     scanf("%d",&a[i]);

    make_ans();

     printf("%d",ans);

}

练习：求L到R中有多少数既是回文数又是素数

1<=L<=R<=10^7

显然枚举素数，再判回文数的话会炸

那我们不妨换个东西枚举，我们枚举回文数。

对于回文数来说，正着读和倒着读都一样，并且只要知道了一半，另一半也就知道了。所以我们直接枚举回文数的一半，再拼出另一半，看是否是素数。对于偶数位的回文数来说，要枚举k/2位（k为位数），奇数位回文数要枚举k/2+1位，而是偶数位数的回文数一定是11的倍数，不用管。

代码如下（本人口胡的....应该是对的吧，要是不对欢迎纠错）

#include<iostream>

#include<cstdio>

#include<cstring>

#include<algorithm>

#include<cmath>

using namespace std;

int n,m,a[],ans;

int l,r;

int make_size(int x)//统计位数

{int an=;

  while(x)

  {an++;

   x/=;

  }

  return an;

}

int ksm(int x,int b)//快速幂的板子（待会分治要讲）

{int r=;

  while(b)

  {if(b&)r*=x;

   x*=x;

   b/=;

  }

  return r;

}

int huiwen(int x)//制作回文数

{int a[],y,z=;

memset(a,-,sizeof(a));

int m=x;

  while(m)

  {y=m%;

   m/=;

   a[++z]=y;

  }//把原数的每一位分出来

  for(int i=;i<=;i++)

  {if(a[i]>=)

   {x*=;//进行复制

     x+=a[i];

   }

  }

  return x;

}

bool check(int x)//判素数

{if(x<=)return ;

  for(int i=;i<=sqrt(x);i++)

    if(x%i==)return ;

 return ;

}

int main()

{ scanf("%d%d",&l,&r);

  int size_l；

  size_l=make_size(l)/;//因为是枚举回文数的一半再复制，所以从l位数的一半开始枚举（这里计算l的位数）

  int kk=ksm(,size_l);//初始的回文数的一半

  for(int i=kk;huiwen(i)<=r;i++)//制作的回文数不大于r才能继续循环

  {int m=huiwen(i);//制作回文数

   if(check(m))ans++;//check判素数（也可以预处理）（我懒）

  }

  printf("%d",ans);

}

枚举的优缺点

所以我们枚举时最好利用一些性质进行枚举

2.搜索

搜索本质上是一种枚举，但是可以表达一些枚举不方便表述的状态

（接下来的东西会越来越难，so有些太难的就不写代码了）

搜索分为深搜和广搜

深搜

也就是dfs(大法师)

举个例子

有多组数据

看的出来，深搜复杂度玄学，所以深搜剪枝是很重要的。

虽然不是澡堂讲的，但我觉得写一下还是有必要的。

大法师dfs剪枝小技巧：

1.在某一顺序会造成很多不明错误时，不妨换一下搜索顺序。

2.如果有几种情况是等效的，那只需对其中一种情况进行搜索

3.及时对当前状态进行检查，如果到了边界，就立即回溯，不要继续搜下去（能省不少时间），也叫上下界剪枝

4.在最优化问题搜索中，如果当前花费超过已找到的最优解，就立即返回。因为继续搜下去，花费一点比最优解大。

5.记忆化搜索

不难看出，在上面的代码中，数据一多就会TLE。这是因为进行重复计算浪费了大量时间。解决办法就是在第一次计算时，将算出的每个f(n)记录下来，搜索到这一项时直接返回，不再进行递归。

#include<iostream>

#include<cstdio>

#include<cstring>

#include<algorithm>

#include<cmath>

using namespace std;

long long n,f[],t;

long long ff(int n)

{ if(n==)f[n]=;

  if(n==)f[n]=;

  if(f[n])return f[n];

  else

  {f[n]=ff(n-)+ff(n-);

   return f[n];

  }

}

int main()

{

    scanf("%lld",&t);

    for(long long i=;i<=t;i++)

    {scanf("%lld",&n);

     printf("%lld",ff(n));

    }

}

输出一种方案

如果有多组解，按字典序输出

这道题看起来让人质壁分离。

我们要用dfs,因为用dfs空间会炸掉。

因为要字典序，所以我们遵循先h再o的顺序搜就好了（代码什么的真好吃）

虽然fz说鬼畜的题用广搜，but这里我们用深搜，

why?广搜你怎么存状态？？？

我们在正方形里，从低到高，从做往右枚举要填进来的正方形（就是维护正方形的下轮廓）

随便举个例子

图中的数字表示枚举的点的顺序

有一个小优化：不重复选用边长相同的小正方形

广搜

广搜主要注意状态的确定。

广搜主要应用之一：迷宫（以下题目100%只说思路，没有代码233）

前面说过，广搜的要点是状态的确定。这里的状态是每个格子的填法。我们可以将每一种填法对应一个数，再用vis[i]记录是否出现过当前状态。

如果有多个数据，就从结果开始搜，搜到初始状态。

代码太难惹2333以后再说qwq。

这里可以经过障碍物。在正常的情况下，障碍物是不能经过的。但这里不正常，所以我们记录状态也不能用正常的记录方式（记录当前步数），而是要记录当前经过的障碍物数。显然，当前经过的障碍物数越小越好，所以我们先扩展当前经过障碍物数量最小的点。而一直遵循这个原则，我们记录的点就只会出现k和k+1这两种状态（k为当前经过障碍物数）。所以我们只要维护两个队列（k和k+1就行了），每次扩展点的时候，扩展同一层的点。

别看题目描述的乱七八糟，其实它就是个暴力。

用四维数组记录人和箱子的位置（人的位置对箱子的方向有影响）然后暴力就是了。

记住，鬼畜的题一般都用广搜，例如下一道

数据保证只有三个固体块（不多也不少）

够鬼畜吧。（当年华容道这游戏虐的我不成人样233）

因为这里固体块不会旋转。所以我们可以用每个固体块的任意一小块来代替这个固体块。在这里我们用每个固体块左上角的小块来代替。

同时以一开始覆盖所以固体块的大矩形为“底”，建立坐标系。

例如：

这样就可以方便的表示每个固体块了。

但因为每种状态是由三个固体块的位置构成，所以要用6维数组，记录每个固体块左上角的坐标。

维度太大，试着降维。

那就固定一个固体块的左上角，使其永远是（0,0），如果该固体块要移动，那就让它旁边的固体块做相对运动。

这样固定下来的固体块的位置就不用讨论了。6维-->4维

再进行广搜，对每个固体块该怎么移动就怎么移动，以及判断一撮balabalabala...........................

这里我们就不管期望了。

多源多汇最短路详情请见明天。
bfs另一个用途：

图论

存储：1.邻接矩阵（空间：n^2）(便于加删)

2邻接表(vector)(访问较快，删除麻烦)（较慢）

vector：存储

弹掉最后一个

计算长度

（还是前向星适合我）

贪心：

每一步选取当前最优。

当不确定时,把多个贪心策略拼一起可以骗分

按照牛奶单价排序，选取即可

让体积最大的和最小的放一个箱子里，如果没有能配成对的就单着

把式子化简一下：

Ai*j-Ai+Bi*n-Bi*j=j*(Ai-Bi)+(n*Bi-Ai)

红字为常数，不用管，然后对(Ai-Bi)排序

这里式子中的Ai不是最大出水量，是0到最大出水量之间的一个数

依旧是化简一下式子：

Σ(Ai)*T=Σ(Ai*ti)=Σ(Ai*T)

ΣAi（ti-T）=0

这里肯定会有

1.ti-T>0 2.ti-T<0

如果得到的水最终的温度是T，就得让这两边的水互相“中和”。又要让最终的总水量尽可能大，所以少的那一边必定全部选上，多的那一边剩余的就不选了

//代码 from fz

#include<cstdio>

#include<algorithm>

#include<cstring>

#define N 300005

using namespace std;

int a[N],t[N],i,j,m,n,p,k,id[N],ID[N],sum[N],T;

double ans;

int cmp(int x,int y)

{

        return sum[x]<sum[y];

}

int main()

{

        scanf("%d%d",&n,&T);

        for (i=;i<=n;++i)

        {

                scanf("%d",&a[i]);

        }

        for (i=;i<=n;++i) scanf("%d",&t[i]);

        for (i=;i<=n;++i)

        {

                if (t[i]==T) ans+=a[i];

                else if (t[i]<T) id[++id[]]=i,sum[i]=T-t[i];

                else ID[++ID[]]=i,sum[i]=t[i]-T;

        }

        sort(id+,id+id[]+,cmp);

        sort(ID+,ID+ID[]+,cmp);

        long long suma=,sumb=;

        for (i=;i<=id[];++i)

            suma+=1ll*sum[id[i]]*a[id[i]];

        for (i=;i<=ID[];++i)

            sumb+=1ll*sum[ID[i]]*a[ID[i]];

        if (suma<sumb)

        {

                swap(suma,sumb);

                for (i=;i<=n;++i) swap(ID[i],id[i]);

        }

        for (i=;i<=ID[];++i) ans+=a[ID[i]];

        for (i=;i<=id[];++i)

            if (1ll*sum[id[i]]*a[id[i]]>=sumb)

            {

                    ans+=.*sumb/sum[id[i]];

                    break;

            }

            else

            {

                    ans+=a[id[i]];

                    sumb-=1ll*sum[id[i]]*a[id[i]];

            }

        printf("%.10lf\n",ans);

}

作业问题：

有n项作业，第i项作业需要ai天完成，而某人希望在第bi天完成这项作业。设ci为第i项作业写完的那一天，则ci-bi就是第i项作业的延迟调度，求最小的延迟调度之和。

我们用策略3.

反例？忘了(@wwww@)

二分

洛谷P2678跳石头

最大距离最小：

设最大距离为mid，看是否可行。

判是否可行：尽量远

mid>=k时，合法，mid<=t时，不合法（k,t为某个数）

二分k,t(最开始t=最大上界(1e9))

这道题看起来是贪心，然而它是二分

总结：用二分把问题变为判定性问题

三分

三分用来计算这种东西的峰值

分治

复杂度：只和k的二进制数位有关

归并排序

|---------------------------------------------------------------------------|

->|-------------------------------------| |----------------------------------|

->|------------------||----------------| |---------------||-----------------|

就类似这样（这是分）

for example:

3 8 6 7

选出3，第一个的左指针右移

-->选出6，第二个的左指针右移

-->如此循环

For example:

/ | \

7 1 7

/ | \ / | \

3 1 3 3 1 3

/ | \ / | \ / | \ / | \

1 1 1 1 1 1 1 1 1 1 1 1

对于每个编号i来说，分治查看i在那棵子树里。

举个例子：i=10;

将上面这棵树从中间分开，中间编号i=8,显然10>8,所以编号为10的元素在右边这棵子树中，再查看下面(图1)这颗树（原图中右边的子树），i此时变为10-8=2，发现i在左边的这棵树(图二)中的第二个元素，是1.

图1 图2

旷世好题之平面最近点对

欧几里得距离就是sqrt((x1-x2)^2+(y1-y2)^2)(就是两点间距离公式)

Day 2

二叉搜索树：

这个比较简单，只需要在每次加入时比较加入的数和当前最大的数，然后更新就行了。

这里扯到了删除，所以就没有上一个题那么简单了。

这时候我们用到了二叉搜索树。

什么是二叉搜索树？

for example

这就是一棵二叉搜索树。

二叉搜索树性质：

对于每一个结点来说，它的左子树严格小于它，右子树严格大于它（这里不讨论有相同数的情况）

我们要利用二叉搜索树来完成这个操作。

因为每个结点左边的值都比右边小，所以要求最小值，就找左儿子，如果没有左儿子的话，那这个点就是最小值。

int findmin()

{

  intx=root;

  while(ls[x])x=ls[x];//只要有左儿子，就继续走

  return key[x];//返回最小值（权值）

}

插入：

我们既要插入，又要维护整棵树的形态，所以我们从根节点开始插入，与当前结点比较。我们用key[root]表示当前点的权值，root为当前点，x为要加入的点的权值。我们比较key[root]和x.

如果key[root]<x,x那就说明x在root的右边，与root的右儿子比较，如果key[root]>x,就将x与root的左儿子比较，最终完成插入

下面的root表示根节点

void put(int x)
{   sum[++tot]=x;//用tot表示二叉树结点的个数
    size[tot]=1;
    if(!root) root=tot//如果没有结点，就让它有结点
    else
    {
         int now=root;//从根开始
         while(true)
         {++size[now];//size[i]表示点i的度（也就是i下面的点数+1）
          if(sum[now]>sum[tot])//判断要插入的点和当前点
           {
             if(!ls[now])//如果当前点没有左儿子
             {
                 ls[now]=tot;fa[tot]=now;//插入，插完就跑
                 break;
             }
             else now=ls[now]//如果有左儿子，就继续比较（按左儿子找）
           }
           else
              {if(!rs[now])
                {rs[now]=tot;fa[tot]=now;
                    break;
                }
               else  now=rs[now];
              }
         }
    }
}

fz鬼才缩进！

删除：

step1.定位结点

从当前点开始，就像刚才插入一样寻找。

int find(int x)

{

     int now=root;

     while(key[now]!=x)

        if(key[now]<x)x=rs[now];//如果当前点的权值比x小，说明x在右子树里

        else  x=ls[now];//否则就在左子树里

     return now;

}

step 2.删除：

我们这里不选择把点置零。（会造成各种奇奇怪怪的困难）

我们考虑点x的儿子的情况。

如果没有儿子，就直接删了

如果有一个儿子，直接让它的儿子认它的父亲为父，然后删掉。

如果有两个儿子，就找到这个点右子树中权值最小的结点y，作为x的后继。然后把y和x的父亲暴力一拼，删除x.就像下图

int find(int x)//查询值为x的数的节点编号

{

    int now=root;

    while (sum[now]!=x&&now)

    if (sum[now]<x) now=rs[now]; else now=ls[now];

    return now;

}

void del(int x)//删除权值为x的点

{

     int  k=find(x),t=fa[k];//找到x的父节点

     if(!ls[k]&&!rs[k])//如果x既没有左儿子，又没有右儿子

      {

          if(ls[t]==k)ls[t]=; else rs[t]=;//x的父亲就没有儿子了

         for(int i=k;i;i=fa[i])   size[i]--;//从x点开始，把它的每个祖宗的度-1

      }

    else if

      (!ls[k]||!rs[k])//只有一个儿子

      {

               int child=ls[k]+rs[k]//把x的儿子的编号弄出来

               if(ls[k])ls[t]=child; else  rs[t]=child;

      }

    else

       {int y=rs[k];while(ls[y])y=ls[y];//找后继

          if(rs[k]==y)//如果后继是x的右儿子

         {if(ls[t]==k)ls[t]=y;else rs[t]=y;

           fa[y]=t;

           ls[y]=ls[k];

           fa[ls[k]]=y;

           for(int i=k;i;i=fa[i])size[i]--;

           size[y]=size[ls[y]]+size[rs[y]];

          }

         else//最可怕的情况

           {  for(int i=fa[y];i;i=fa[i]) size[i]--;

               int tt=fa[y];

               if(ls[tt]==y)

               {ls[tt]=rs[y];//如果y是它爹的左儿子，那就让y唯一的儿子（右儿子）代替y原本的位置（y要提上去）

                 fa[rs[y]]=tt;

                }

              else

              {rs[tt]=rs[y];

                fa[rs[y]]=tt;

               }

             if(ls[t]==x)//再提x

              {ls[t]=y;//如果x是它爹的左儿子，就更新为左儿子为y

               fa[y]=t;

               ls[y]=ls[k];

               rs[y]=rs[k];

              }

             else

             {rs[t]=y;//按右儿子更新

              fa[r]=t;

              ls[y]=ls[k];

              rs[y]=rs[k];

             }

             size[y]=size[ls[y]]+size[rs[y]]+;

           }

       }

}

小扩展：

求许多数中第k大的数。

看起来一个sort可以解决的样子

来我们讨论下用二叉搜索树怎么解决

前面我们提到了size[i]，我们用它表示i这个节点子树里节点的个数。

我们从根开始走，如果右子树的size>=k,说明第k大值在右子树里。反之就在左子树里。当然，如果右子树的size+1=k,就说明当前这个点就是最大值。因为右子树的size+1就是当前点的size。这样就可以递归求解了。在每次递归到下一层时，如果到了左子树，要注意把当前的k减去右子树的size,然后-1。

int find_kth(int now,int k)

{

       if(size[rs[now]]>=k)return find_kth(rs[now],k);//分别对应上面三种情况

       if(size[rs[now]]+==k)return  key[now];

       return find_kth(ls[now],k-size[now]-);

}

对于正常插入和删除的size维护可以总结为一下几点：

插入：沿路增加。

删除：1.size[fa[i]-1](无儿子)

2.只有右儿子：沿路的父亲节点size-1

3.左右儿子都有：从y往上一直到x的父亲，一路-1.（具体代码中都有）

二叉搜索树排序：

这里我们要用到二叉搜索树的性质。

对于二叉搜索树来说，每个结点的左子树严格小于它，即左子树中不会有权值比它大的点，而右子树严格大于它，即不会有权值比它小的点。这样我们做一次中序遍历就可以得到一个排序了。

中序遍历：遵循左中右原则。

举个例子：

箭头为遍历顺序，点上的数字为输出的顺序

深搜即可解决

int dfs(int now)

{

   if(ls[now])dfs(ls[now])

   printf("%d",key[now]);

   if(rs[now]) dfs(rs[now]);

}

就像第二个例子，画出来的树是成链的

这种数据遍历起来复杂度就有点崩溃（复杂度为树的高度）

二叉堆

基础

我们可以手写，也可以用系统堆（个人感觉还是优先队列好用qwq）

这里注意一下堆的插入是从下一路向上比，而二叉搜索树是从根节点一路往下比。

修改一个点的权值：

咦，为什么没有删除最小值?

删除最小值只要把一个权值改到无穷大就能解决辣

比较简单的是把一个权值变小。

那只要把这个点像插入一样向上动就行了。

权值变小：上浮（就是从下往上比）

权值变大：下沉（就是从上往下比）

定位问题：

寻找权值为x的点的编号；

假设权值两两不同，再记录一下某个权值现在哪个位置。（用辅助数组pos[权值]=位置）

在交换权值的时候顺便交换位置信息。

int find(int x)

{

    return pos[x];

}

void up(int now)

{

    while(now&&a[now]<a[now/])

     {swap(a[now],a[now/];

      swap(pos[now],pos[now/]); //注意pos要跟着一起变

       now/=;

     }

}

void down(int now)

{

    while(now*<=n)

    {if(a[now]>a[now*])

          {swap(a[now],a[now*];

            swap(pos[now],pos[now*]);

            now*=;

           }

     else

        {

              if (a[now]<=a[now*]&&a[now]<=a[now*+]) break;

          if (a[now*]<a[now*+])

               { swap(a[now],a[now*]);

                  swap(pos[now],pos[now*]);

                   now*=;

                }

          else

              {swap(a[now],a[now*+]);

                swap(pos[now],pos[now*+]);

                now=now*+;

         }

     }

}

//以上是变换

删除：先赋值为inf,再下沉（元素会特别多）

可以把最后一个结点放到根上，然后再下沉（与此同时n - -）

应用：

堆排序

把数全部插进去，每次询问最小值，然后把根删掉就行了.

看道题：

丑数

丑数指的是质因子中仅包含2,3,5,7的数，最小的丑数是1,求前k个丑数。

K ≤ 6000

看起来好像可以打表，但这样不优雅。

ps:打表小技巧：把要打的数拼尽全力转为100进制用字符串存，省时间省空间费脑子。

（也可以打一个巨长的表卡编译器10min）

好了说正经的。

我们选中x后，接下来我们要选2x,3x,5x,7x,我们把这些数塞进堆里，每次取的时候和上一次取出来的数比较，如果不同，就输出，并且计数器+1，如果相同，就不要。因为堆是有序的，而且我们维护的是一个小根堆。

一些方便的东西：

1.queue

queue里面有一个叫priority_queue,也就是所说的优先队列。这是一个大根堆，不过我们可以做点什么让它变成小根堆。

例如这样

函数：

q.push() 插入

q.top() 返回

q.pop() 弹掉

q.clear() 清空

2.set（高级的二叉搜索树）

st.insert( x )插入（不会插入两个相同的东西）

st.erase( x )删除

st.find( x )看是否存在某个数

st.lower/upper bound():

lower_bound( x ):找到第一个大于等于x的数的地址。

upper_bound( x ):找到第一大于x的数的地址

st.begin()/st.end()取最小/最大值后面的一部分

ser<int>::iterator it=st.lower_bound(x)

上面的it可以进行：it++ or i--(其他操作不行)

set可维护有序数组（可以代替系统堆（可能有点慢233，不过操作多））

区间RMQ问题：

给出一个长度为N的序列，我们会在区间上干的什么(比如单点加（给一个点加），区间加（给一个区间内的所有点加），区间覆盖),并且询问一些区间有关的信息(区间的和,区间的最大值)等。

例一：

给出一个序列，每次询问区间最大值.

N ≤ 100000,Q ≤ 1000000.

我们先抛开最大值不谈，如果这个题要求和的话，只用求出前缀和就好，因为[l,r]的权值之和等于[1,r]-[1,l-1].

那我们回到这个题，是否可以模拟求和的思路，通过求出类似前缀和的东西，来求出区间的的最大值呢？当然可以。这道题所有的数给定后就不会动了，所以这是个静态的。并且是可重复计算（可重复计算特指求最大值或最小值），我们就可以用st表。

st表思想：

先求出每个[i,i+2^k)的最值，然后找出两个区间包住询问的区间，这两个区间的最值就是答案。

我们注意到这样的区间总数是nlogn的（i有n个，k有logn个）

这个题里，我们不妨设f[i][j]是[i,i+2^j)的最小值。

首先，f[i][0]都是i.

其次，f[i][j]=min(f[i][j-1],f[i+j-1][j]);下面这个图就可以解释一下

|------------| |------------|

i i+2^(j-1) i+2^j

知道了这些，就可以处理整个st表了。

那如何寻找那两个区间？

先找最大的k满足2^k<=r-l+1（r-l+1是整个区间的长度）

我们找到这样的k,那[l,l+2^k),[r-2^k+1,r+1）这两个区间自然就能包住整个[l,r),而且不会出现[l,r]之外的部分。

|--------------------| 区间[l,r]

|---------------| 区间[l,l+2^k)

|----------------|区间[r-2^k+1,r+1）

这是图示

找到这两个区间后，f[l][k],f[l+2^k+1][r]中较小的一个就是答案。这样每次询问时只需要找区间，复杂度o(1)

再来看一道

给出一个序列，支持对某个点的权值修改，或者询问某个区间的最大值.

N,Q ≤ 100000.

这道题和刚才那道题的区别就在于这里每个点的权值是有可能变的，所以就不再是静态的，而是动态的。那我们还能不能继续用st表做呢？试一下。

比如改5这个点.

j = 0 改了一个位置，嗯，完美.

j = 1 改了两个位置4,5,稳.

j = 2 改了四个位置2,3,4,5,还行

j = 3,emmmmmm好像不太妙。

我们注意到当j往上走的时候，要改的区间个数是这个点的编号。j是指2^j的那个j.

看来现在修改一侧就要修改O（N）个点

看起来会炸

既然st表不靠谱，那咋办？

那我们肯定就不能用静态求最值的东西了。我们换一个动态的。

线段树

本质是一棵不会改变形态的二叉树.

树上的每个节点对应于一个区间[a,b](也称线段),a,b通常为整数

同一层的节点所代表的区间，相互不会重叠

同一层节点所代表的区间，加起来是个连续的区间

对于每一个非叶结点所表示的结点[a,b]，其左儿子表示的区间为[a,(a+b)/2]，右儿子表示的区间为[(a+b)/2+1,b](除法去尾取整）

就像下面：

这里的从中间开始是指该结点的两个儿子是由它从中间剖开得到的。

这个线段树也演示了一个区间拆分的过程。

区间拆分：

将一个区间[a,b]拆成若干个结点，使这些结点加起来还是区间[a,b]，且互不重叠。对于在[a,b]内的一个区间[l,r]来说，如果在区间拆分过程中拆出的结点所代表的区间在[l,r]内，就称这个结点为终止结点。这个拆出来的区间就是终止区间。

和st表有什么区别？

1.st表是静态的，而线段树是可以动态的。

2.st表会有重叠，而线段树不会有重叠。

如何进行区间拆分？

从根节点[1,n]开始，考虑当前节点是[L,R].

如果[L,R]在[a,b]之内,那么它就是一个终止节点.

否则,分别考虑[L,Mid],[Mid + 1,R]与[a,b]是否有交,递归两边继续找终止节点.

哪边有交就往哪走

来我们看几道好题。

一.给一个数的序列A1 ,A2 ,...,An .并且可能多次进行下列两个操作：

1.对序列里面的某个数进行加减

2.询问这个序列里面任意一个连续的子序列A i ,A i+1 ...A j 的和是多少.

希望单个操作能在O(logN)的时间内完成.

通过阅读上下文可知这题要用线段树。

运用线段树，每个区间要记录的是？

ΣAi

对于操作1，我们相当于对[i,i]做了一个区间拆分（最后要拆出来[i,i]）,沿路我们找到所有的祖先结点，维护记录的和（每个结点的答案为它的左儿子+它的右儿子）。

对于操作2，我们对给的区间[l,r]做一个区间拆分，将拆分出的每一个终止结点的和累加起来就是答案。（代码什么的先不管了233）

二

给定Q个数A 1 ,...,A Q ,多次进行以下操作:

1.对区间[L,R]中的每个数都加n.

2.求某个区间[L,R]中的和.

Q ≤ 100000

乍一看，好像见过。

哎这不对啊，咋是区间加呢？说好的单点加呢？

区间加，我们就得好好考虑考虑了。暴加一定会炸。

大家都遇到过拖更的现象吧。在这里我们也采用拖更这种想法。先把要加的数用inc记下来，要是询问到这个区间，就加上，不然就不加了，还省时间。在区间增加时，如果要加的区间正好覆盖一个结点（也就是到了终止结点），就增加其inc和sum（这里sum是当前结点的真实值），不再往下走。

回来更新：由左右儿子加和。

拖更思想更新延迟的代码

旷世好题*2

显然这里砖多的令人头疼。咱想想办法给他降一下数量。既然要降砖块的数量，那就不能管砖的面积是多大了。

我们把所有海报端点去重排序最终可以降成4w块

因为海报的端点最多20000个（这里的“端点”是海报的边的横坐标），一定有海报中间的部分跨过好几块砖，我们就把那好几块砖视作一块

那么我们从最底层的海报开始，一张一张往上贴.

对于一个区间[L,R],我们记录的信息是这个区间整体被第几张海报覆盖了,初始值设为−1. (区间拆分and延迟更新)

对于一张包含[L,R]的海报i,我们就只需要把[L,R]里面所有的位置都赋成i就可以了。

注意利用区间分解和延迟更新的方法.

本题中是否会有标记时间冲突的问题?(先来的覆盖后来的)

不会发生，只有可能后来的覆盖先来的。

这样我们结合延迟更新的思想，将每一块的标记向下传。

给出长度为N的序列A,

Q次操作，两种类型:

(1 x v),将A x 改成v.

(2 l r) 询问区间[l,r]中有多少段不同数。例

如2 2 2 3 1 1 4,就是4段。

N,Q ≤ 100000.

这里我们用线段树只记录每个区间的段数一定会出错。为什么呢？线段树区间拆分过后，会把整个大区间分成n个小区间，每个区间的段数都由它的左右儿子的段数相加得来。but真的对吗？

我们摘出来线段树的一部分，这里[1,2]和3的段数都是1，但[1,3]的段数还是1。原因就在于我们合并区间时，会出现[1,2]最右边和3最左边的数相同的情况。为了保证正确性，我们不仅要记录每个区间的段数，还要记录每个区间最左边和最右边的数。

若合并时遇见相同，就段数加起来-1，否则就加起来

树状数组

树状数组：常用来求前缀和。

什么是树状数组？

先看一下这棵树

这样偏了一下，就是树状数组的结构。

对于树状数组C,C[i]=A[i-lowbit[i]]+...........+A[i].

什么是lowbit?简单来说就是i&(-1)

为什么？我也不知道呀

前缀和是指A1+A2+A3+A4+A5+...............+Ak，可以拆成C[k]+C[m]+C[t]+...........

其中m=k-lowbit(k),t=m-lowbit(m)......为什么呢？自己举几个例子就知道了。

#include<cstdio>

#include<algorithm>

#include<cstring>

#include<iostream>

#include<cstring>

#include<string>

#include<cmath>

#include<ctime>

#include<set>

#include<vector>

#include<map>

#include<queue>

#define N 300005

#define M 8000005

#define ls (t<<1)

#define rs ((t<<1)|1)

#define mid ((l+r)>>1)

#define mk make_pair

#define pb push_back

#define fi first

#define se second

using namespace std;

int i,j,m,n,p,k,C[N],a[N],b[N];

long long ans;

int lowbit(int x)

{

        return x&-x;

}

void ins(int x,int y)//修改a[x]的值,a[x]+=y;

{

        for (;x<=n;x+=lowbit(x)) C[x]+=y; //首先需要修改的区间是以x为右端点的,然后下一个区间是x+lowbit(x),以此类推

}

int ask(int x) //查询[1,x]的值

{

        int ans=;

        for (;x;x-=lowbit(x)) ans+=C[x]; //我们询问的]是[x-lowbit(x)+1,x,然后后面一个区间是以x-lowbit(x)为右端点的，依次类推

        return ans;

}

int main()

{

        scanf("%d",&n);

        for (i=;i<=n;++i) scanf("%d",&a[i]),b[++b[]]=a[i];

        sort(b+,b+b[]+); b[]=unique(b+,b+b[]+)-(b+);

        for (i=;i<=n;++i) a[i]=lower_bound(b+,b+b[]+,a[i])-b;

        for (i=;i<=n;++i) ans+=(i-)-ask(a[i]),ins(a[i],);

        printf("%lld\n",ans);

}

有什么用呢？

我们可以用前缀和相减的方式来求区间和.询问的次数和n的二进制里1的个数相同.是O(logN).求一个数组A 1 ,A 2 ,...,A n 的逆序对数.n ≤ 100000,|A i | ≤ 10 9 .

我们将A 1 ,...,A n 按照大小关系变成1...n.这样数字的大小范围在[1,n]中.（就是离散化）

维护一个数组B i ,表示现在有多少个数的大小正好是i.

从左往右扫描每个数,对于A i ,累加B A i +1 ...B n 的和,同时将B A i 加1。

时间复杂度为O(N logN).

LCA

在一棵有根树中,树上两点x,y的LCA指的是x,y向根方向遇到到第一个相同的点。

比如：这个图中的两个蓝色的结点的LCA就是根结点。

求法：

我们记每一个点到根的距离为deep x .注意到x,y之间的路径长度就是deep x + deep y − 2 * deep LCA。两个点到根路径一定是前面一段不一样，后面都一样.注意到LCA的深度一定比x,y都要小.利用deep，把比较深的点往父亲跳一格，直到x,y跳到同一个点上. 这样做复杂度是O(len).(每个点跳到公共祖先上)

考虑一些静态的预处理操作.像ST表一样，设fa (i,j) 为i号点的第2^ j 个父亲。

就像这个图演示的一样。

思想：st表

利用类似快速幂的想法.（二分）

每次跳2的整次幂，一共跳log次.

首先不放假设deep x > deep y .为了后续处理起来方便，我们先把x跳到和y一样深度的地方.

如果x和y已经相同了,就直接退出.否则,由于x和y到LCA的距离相同,倒着枚举步长,如果x,y的

第2 ^j 个父亲不同，就跳上去.这样，最后两个点都会跳到离LCA距离为1的地方，在跳一步就行了.

时间复杂度O(N logN).

LCA在图论里会发挥很大的作用

倍增

我们之前讲了分治，就是把一个大的东西分成小的，解决每个小的。而倍增就是反过来，从小的翻成大的。

时间复杂度O(nlogn)-O(logn)O(n logn)

并查集

基础

在基础里我们讲到的优化是路径压缩，这里写出所有的优化

优化：

在寻找一个点的顶点时，把这个点的父亲改为其顶点。（路径压缩）（对找爹的优化）
按秩合并。（对合并的优化）

对每个顶点，再多记录一个当前整个结构中最深的点到根的深度deep x .

注意到两个顶点合并时,如果把比较浅的点接到比较深的节点上.

如果两个点深度不同，那么新的深度是原来较深的一个.

只有当两个点深度相同时，新的深度是原来的深度+1.

注意到一个深度为x的顶点下面至少有2 x 个点,所以x至多为logN.

那么在暴力向上走的时候,要访问的节点至多只有log个.

（结合路径压缩复杂度会特别低（不过可能数组会有点问题））

（建议结合暴力找爹）

But路径压缩比按秩合并优秀。不过路径压缩复杂度不严格。按秩合并复杂度严格o(log n)

按秩合并:

void Merge(int x,int y)

{

    x=get(x); y=get(y);// 使用的是最暴力的get

    if (deep[x]<deep[y]) fa[x]=y;

    else if (deep[x]>deep[y]) fa[y]=x;

    else deep[x]++,fa[y]=x;

}

例题1:

有N个变量，M条语句，每条语句为x i = x j ,或者x i <> x j ，询问这M条语句是否都有可能成立.

N ≤ 10 9 ,M ≤ 100000.

我们先离散化处理出可能出现的变量的大小关系，并把大小相同的变量并到一个集合里。如果同一个变量被并到了两个不同的集合里，就说明不合法。

例题2：

有n个学生，编号0到n − 1, 以及m个团体,0 < n ≤ 30000,0 ≤ m ≤ 500).一个学生可以属于多个团体,也可以不属于任何团体.一个学生疑似疑似患病,则它所属的整个团体都疑似患病。已知0号学生疑似患病，以及每个团体都由哪些学生构成，求一共多少个学生疑似患病.

我们把属于同一个团体的学生并起来，再把患病的学生并起来，最后看和0在同一集合里的学生人数。

好题++:

最后一句要联系更新延迟思想，先打上标记，等到询问的时候再加上个数。

当然也可以这样做：

这样相当于在找根的过程中，把根上的标记拿了下来。

好题++：

有木有很眼熟？

但这里改了一下，每个变量只有0,1两种取值。

举个例子：ai≠aj,aj≠ak,ak≠ai在这里是不成立的，而在刚才的那道题里就是成立的。

所以应该怎么做呢？我们注意到这里的变量非0即1.我们把一个点分成x和x',如果x是0，那x'就是1，反之x'是0.将x和y比较，如果x=y,那么x向y建边，x'向y'建边。反之x向y'建边，x'向y建边。最后查询x和x'的关系，如果在同一集合里，就是不合法的。

五一清北学堂培训之数据结构（Day 1&Day 2）的更多相关文章

五一清北学堂培训之Day 3之DP
今天又是长者给我们讲小学题目的一天长者的讲台上又是布满了冰红茶的一天 ---------------------------------------------------------------- ...
7月清北学堂培训 Day 3
今天是丁明朔老师的讲授~ 数据结构绪论下面是天天见的: 栈,队列: 堆: 并查集: 树状数组: 线段树: 平衡树: 下面是不常见的: 主席树: 树链剖分: 树套树: 下面是清北学堂课程表里的: S ...
10月清北学堂培训 Day 2
今天是杨溢鑫老师的讲授~ T1 物理题,不多说(其实是我物理不好qwq),注意考虑所有的情况,再就是公式要推对! #include<bits/stdc++.h> using namespa ...
8月清北学堂培训 Day1
今天是赵和旭老师的讲授~ 动态规划动态规划的基本思想利用最优化原理把多阶段过程转化为一系列单阶段问题,利用各阶段之间的关系,逐个求解. 更具体的,假设我们可以计算出小问题的最优解,那么我们凭借此可 ...
8月清北学堂培训 Day4
今天上午是赵和旭老师的讲授~ 概率与期望 dp 概率某个事件 A 发生的可能性的大小,称之为事件 A 的概率,记作 P ( A ) . 假设某事的所有可能结果有 n 种,每种结果都是等概率,事件 A ...
8月清北学堂培训 Day2
今天是赵和旭老师的讲授~ 背包 dp 模型背包 dp 一般是给出一些“物品”,每个物品具有一些价值参数和花费参数,要求在满足花费限制下最大化价值或者方案数. 最简单几种类型以及模型: 0/1背包: ...
7月清北学堂培训 Day 5
今天是钟皓曦老师的讲授~ 动态规划动态规划的三种实现方法: 1.递推: 2.递归: 3.记忆化: 举个例子: 斐波那契数列:0,1,1,2,3,5,8…… Fn = Fn-1 + Fn-2 1.我们 ...
2017 五一清北学堂 Day1模拟考试结题报告
预计分数:100+50+50 实际分数:5+50+100 =.= 多重背包 (backpack.cpp/c/pas) (1s/256M) 题目描述提供一个背包,它最多能负载重量为W的物品. 现在给出 ...
10月清北学堂培训 Day 7
今天是黄致焕老师的讲授~ 历年真题选讲 NOIP 2012 开车旅行小 A 和小 B 决定外出旅行,他们将想去的城市从 1 到 n 编号,且编号较小的城市在编号较大的城市的西边.记城市 i 的海拔高 ...

随机推荐

java_第一年_JavaWeb（11）
自定义标签:主要是用来移除JSP页面中的java代码. 先从一个简单的案例了解其怎么移除代码: 一个正常的jsp页面: <%@ page language="java" pa ...
【洛谷p1077】摆花
题外废话: 真的超级喜欢这道题摆花[题目链接] yy一提醒,我发现这道题和[洛谷p2089] 烤鸡有异曲同工之妙(数据更大了更容易TLE呢qwq) SOLUTION1:(暴搜) 搜索:关于搜索就不用 ...
[2019杭电多校第五场][hdu6625]three arrays（01字典树）
题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=6625 大意为给你两个数组a和b,对应位置异或得到c数组,现在可以将a,b数组从新排序求c数组,使得字典 ...
ML5238电池管理芯片笔记
根据公司需要开发了以ML5238电池管理芯片+STM8S为核心的电池管理系统.由于前期对BMS系统还是了解甚少,开发起来也遇到了不少困难.再开发管理系统的同时,我也开发了管理系统的上位机, ...
[集合]List
List 存取有序,有索引,可以重复 ArrayList去除集合中字符串的重复值(字符串的内容相同) public static void main(String[] args) { ArrayLis ...
kotlin和vertx和mongo写的一个服务器验证登陆功能（很简陋）
包结构长这个样子: server包:(服务器相关配置) HttpServer:用ver.x创建了一个http服务器,把接收到的req请求传入RPCRequest中: RPCRequest:解析请求bo ...
【focus-lei 】微服务
随笔分类 - 微服务 .net core使用NLog+Elasticsearch记录日志摘要:在微服务或分布式系统中,如果将日志作为文件输出,查看系统日志将非常不便:如果将日志保存到数据库中,又不能 ...
C# 委托和事件实现窗体间的通信
例子 : 点击form1上的按钮打开form2窗口,在form2窗体中的文本框中输入一个值后,在点击form2窗体中按钮,在form2中的文本框中输入的值也会在form1中的文本框中出现. form1 ...
redis-Nosql
Nosql: CAP:C(Consistency):强一致性.A(Availability):可用性.P(Partitio Tolerance):分区容错性 CAP 理论的核心是: 一个分布式系统,不 ...
centos下通过conda安装pytorch
一.安装anaconda anaconda安装简单,只要确定自己的系统即可,具体安装请参考这里二.确定自己的系统版本我的是centos cat /etc/redhat-release 查看linu ...

五一清北学堂培训之数据结构（Day 1&Day 2）

五一清北学堂培训之数据结构（Day 1&Day 2）的更多相关文章

随机推荐

热门专题