题目链接

本文旨在介绍树上背包的优化。

可见例题,例题中N,M∈[1,100000]N,M \in [1,100000]N,M∈[1,100000]的数据量让O(nm2)O(nm^2)O(nm2)的朴素树上背包T到飞起,我们需要考虑优化。

个人会将各种优化讲到极限(当然是本蒟蒻的极限)。

根据一番学习,我也认为上下界优化最简单易理解……

上下界优化这位神犇的博客相当不错了:戳我%他

我也口胡两句吧。

普通做法:

for (j=m+1;j>=1;--j)//枚举背包容量
for (k=1;k<j;++k)//枚举在子树中选择多少
f[u][j]=max(f[u][j],f[u][k]+f[v][j-k]);

那么size优化非常简单好想:

for (j=min(m+1,size[u]);j>=1;--j)//枚举背包容量
for (k=1;k<j&&k<=size[v];++k)//枚举在子树中选择多少
f[u][j]=max(f[u][j],f[u][k]+f[v][j-k]);

道理也很简单,选完就那么多,肯定不能枚举到超过的。

于是能AC这道题,用时17s17s17s。

但再想想,我们选择的kkk的下界其实也是会被约束的。

因为选到jjj的总容量的时候,假定前面的全部取完,kkk都必须要到达一个值才能满足条件。

例子:

size[u]=size[son1]+size[son2]+size[son3]size[u] = size[son1] + size[son2] + size[son3]size[u]=size[son1]+size[son2]+size[son3]

我们枚举时,比如j=size[son1]+size[son2]+aj = size[son1] + size[son2] + aj=size[son1]+size[son2]+a的情况,

我们至少要在son3son3son3中取a个节点才能达到此容量。

因此就能得到上下界优化:

void dfs(int u)
{
siz[u]=1;
f[u][1]=a[u];
int i,j,k,v;
for (i=head[u];i;i=nxt[i])
{
v=to[i];
dfs(v);
for (j=min(m+1,siz[u]+siz[v]);j>=2;--j)//这里做了小改动,因为1的更新肯定没有意义
for (k=max(1,j-siz[u]);k<=siz[v]&&k<j;++k)
f[u][j]=max(f[u][j],f[u][j-k]+f[v][k]);
siz[u]+=siz[v];
}
}

这里对sizesizesize数组的更新做了特殊处理,可以更方便地得到前面所有子树的节点数总和。于是更进一步,达到了12s的成绩。

那么还能不能更快呢?其实是可以的。

我们发现内层循环需要2个判断语句,有什么办法缩成一个?

当然可以开临时变量来存,但我们甚至可以换一种dp方式!(思路来源于某位神犇,他的代码用了刷表法无师自通地进行了O(nm)O(nm)O(nm)优化导致过去“指点”的我转为“%%%”状态)

刷表法

刷表法怎么写呢?其实也很简单:

void dfs(int u)
{
siz[u]=1;
f[u][1]=a[u];
int i,j,k,v;
for (i=head[u];i;i=nxt[i])
{
v=to[i];
dfs(v);
for (j=min(m,siz[u]);j>=1;--j)//在之前子树&&根中选择的节点数,这里要取1是因为肯定要取根节点
for (k=1;k<=siz[v]&&j+k<=m+1;++k)//在当前子树取得节点数
f[u][j+k]=max(f[u][j+k],f[u][j]+f[v][k]);
siz[u]+=siz[v];
}
}

这时候,我们就可以将内层循环的两个判断语句合为一个了:

void dfs(int now)
{
size[now] = 1;
f[now][1] = w[now];
int v;
for (int p = head[now]; p; p = lines[p].next)
{
v = lines[p].to;
dfs(v);
for (int j = min(size[now], m); j; --j)
for (int k = min(size[v], m + 1 - j); k; --k)
f[now][j + k] = max(f[now][j + k], f[now][j] + f[v][k]);
size[now] += size[v];
}
}

省去了一个判断,对常数的优化还是不可小觑的。

下标映射

对于例题,由于n,mn,mn,m过大,开二维肯定开不下,肯定要扁平化为一维。

因为有一个超级源点,因此背包最大容量其实为m+1m+1m+1,而[0,m+1][0,m+1][0,m+1]间有m+2m+2m+2个位置。

故有:

inline int pos(const int &x,const int &y)
{
return x * (m+2) + y;//注意此处x可能为0
}

但是事实上,每次都计算这个pos带来了大量的计算。多大量呢?

当初用填表法时,我将这个函数换成了definedefinedefine,总时间从12s12s12s提升到了8s8s8s。

显然因为这个pospospos反复计算,消耗了大量的时间。

那么是否还有比宏定义更优的方法呢?我翻了翻最优解,除了题目作者本人在调整数据规模时的弱数据AC外,第一位是一位名为WarlockAkk的神犇,用时仅4.2s4.2s4.2s!

这究竟是何等黑魔法?我点开源码开始膜拜,于是看到:

bfo(i,0,n+1){
d[i]=spa+idx;
idx+=m+2;
}

这是什么意思呢?ddd是一个int∗int*int∗的数组,于是我恍然大悟:

可以预处理出一个映射数组,将二维的对映射数组的访问映射到一维的保存数组中。

具体实现方式:

int dp[100001000];
int *f[MAXN]; //f[i][j] points to the dp arr.
int k, pointer = 0;
f[0] = &dp[0]; //special
for (int i = 1; i <= n; ++i)
{
pointer += m + 2;
f[i] = &dp[pointer]; //special
}

我们将这两行代码插入到读入的循环中,就可以得到映射数组fff,我们就能直接用f[i][j]f[i][j]f[i][j]来访问了!

并且因为f[i]f[i]f[i]存的索引直接加上jjj就能得到地址,我们实际上避免了两个大数的乘法,而使其变成了加法。

举例:

原先访问方式:

dp[x∗(m+2)+y]dp[x * (m+2) + y ]dp[x∗(m+2)+y] 进行了一次乘法一次加法

解析一下就是:

return dp + (x * (m+2) + y);

而现在的访问方式:

(f[x]+y)(f[x] + y)(f[x]+y)

解析一下就是:

return (f + x) + y;

效率提升相当显著。

同时注意我们的预处理方式:

int pointer = 0;
pointer += m + 2;

写成加法的形式,与乘法形式对比:

pointer = (m + 2) * i;

效率如何很显然了。

那么下标映射后到底有多快呢?

有多快呢?

我们看结论吧。

总结

填表法 填表法 with O(2) 刷表法 刷表法 with O(2) 下标映射 + 刷表法 with O(2)
8s8s8s 7.5s7.5s7.5s 7s7s7s 6.5s6.5s6.5s 2.4s2.4s2.4s

可以发现,吸氧对于这种情况提升不明显。

而下标映射 快、极快、巨快!



因此在卡常优化时我们可以多想想使用指针等玄学进行优化,往往会有意想不到的提升。

如lower_boundlower\_boundlower_bound等函数直接使用迭代器等……

That’s all.

Code

#pragma GCC target("avx")
#pragma GCC optimize(2)
#pragma GCC optimize(3)
#pragma GCC optimize("Ofast")
#pragma GCC optimize("inline")
#pragma GCC optimize("-fgcse")
#pragma GCC optimize("-fgcse-lm")
#pragma GCC optimize("-fipa-sra")
#pragma GCC optimize("-ftree-pre")
#pragma GCC optimize("-ftree-vrp")
#pragma GCC optimize("-fpeephole2")
#pragma GCC optimize("-ffast-math")
#pragma GCC optimize("-fsched-spec")
#pragma GCC optimize("unroll-loops")
#pragma GCC optimize("-falign-jumps")
#pragma GCC optimize("-falign-loops")
#pragma GCC optimize("-falign-labels")
#pragma GCC optimize("-fdevirtualize")
#pragma GCC optimize("-fcaller-saves")
#pragma GCC optimize("-fcrossjumping")
#pragma GCC optimize("-fthread-jumps")
#pragma GCC optimize("-funroll-loops")
#pragma GCC optimize("-fwhole-program")
#pragma GCC optimize("-freorder-blocks")
#pragma GCC optimize("-fschedule-insns")
#pragma GCC optimize("inline-functions")
#pragma GCC optimize("-ftree-tail-merge")
#pragma GCC optimize("-fschedule-insns2")
#pragma GCC optimize("-fstrict-aliasing")
#pragma GCC optimize("-fstrict-overflow")
#pragma GCC optimize("-falign-functions")
#pragma GCC optimize("-fcse-skip-blocks")
#pragma GCC optimize("-fcse-follow-jumps")
#pragma GCC optimize("-fsched-interblock")
#pragma GCC optimize("-fpartial-inlining")
#pragma GCC optimize("no-stack-protector")
#pragma GCC optimize("-freorder-functions")
#pragma GCC optimize("-findirect-inlining")
#pragma GCC optimize("-fhoist-adjacent-loads")
#pragma GCC optimize("-frerun-cse-after-loop")
#pragma GCC optimize("inline-small-functions")
#pragma GCC optimize("-finline-small-functions")
#pragma GCC optimize("-ftree-switch-conversion")
#pragma GCC optimize("-foptimize-sibling-calls")
#pragma GCC optimize("-fexpensive-optimizations")
#pragma GCC optimize("-funsafe-loop-optimizations")
#pragma GCC optimize("inline-functions-called-once")
#pragma GCC optimize("-fdelete-null-pointer-checks")
#include <cstdio>
using namespace std;
const int MAXN = 100100;
inline int max(const int &a, const int &b) { return a > b ? a : b; }
inline int min(const int &a, const int &b) { return a < b ? a : b; }
char buf[100000], *p1 = buf, *p2 = buf;
#define nc() p1 == p2 && (p2 = (p1 = buf) + fread(buf, 1, 100000, stdin), p1 == p2) ? EOF : *p1++
template <typename T>
inline void read(T &r)
{
static char c;r = 0;
for (c = nc(); c > '9' || c < '0'; c = nc());
for (; c >= '0' && c <= '9'; r = (r << 1) + (r << 3) + (c ^ 48), c = nc());
}
struct node
{
int to, next;
node() {}
node(const int &_to, const int &_next) : to(_to), next(_next) {}
} lines[MAXN];
int head[MAXN];
void add(const int &x, const int &y)
{
static int tot = 0;
lines[++tot] = node(y, head[x]), head[x] = tot;
}
int n, m;
int dp[100001000];
int *f[MAXN]; //f[i][j] points to the dp arr.
int size[MAXN], w[MAXN];
void dfs(int now)
{
int v;
size[now] = 1;
f[now][1] = w[now];
for (int p = head[now]; p; p = lines[p].next)
{
v = lines[p].to;
dfs(v);
for (int i = min(size[now], m); i; --i)
for (int j = min(size[v], m + 1 - i); j; --j)
f[now][i + j] = max(f[now][i + j], f[now][i] + f[v][j]);
size[now] += size[v];
}
}
int main()
{
read(n);
read(m);
int k, pointer = 0;
f[0] = &dp[0]; //special
for (int i = 1; i <= n; ++i)
{
pointer += m + 2;
f[i] = &dp[pointer]; //special
read(k);
add(k, i); //we can set the point(0) into a vitual node,which is the root of the tree
read(w[i]);
}
dfs(0);
printf("%d", f[0][m + 1]);
return 0;
}~~~

[U53204] 树上背包的优化的更多相关文章

  1. Hdu 6268 点分治 树上背包 bitset 优化

    给你一颗大小为n(3000)的树,树上每个点有点权(100000),再给你一个数m(100000) i为1~m,问树中是否存在一个子图,使得权值为i. 每次solve到一个节点 用一个bitset维护 ...

  2. 洛谷 P2015 二叉苹果树 (树上背包)

    洛谷 P2015 二叉苹果树 (树上背包) 一道树形DP,本来因为是二叉,其实不需要用树上背包来干(其实即使是多叉也可以多叉转二叉),但是最近都刷树上背包的题,所以用了树上背包. 首先,定义状态\(d ...

  3. 【BZOJ】4033: [HAOI2015]树上染色 树上背包

    [题目]#2124. 「HAOI2015」树上染色 [题意]给定n个点的带边权树,要求将k个点染成黑色,使得 [ 黑点的两两距离和+白点的两两距离和 ] 最大.n<=2000. [算法]树上背包 ...

  4. 【2019.8.9 慈溪模拟赛 T2】摘Galo(b)(树上背包)

    树上背包 这应该是一道树上背包裸题吧. 众所周知,树上背包的朴素\(DP\)是\(O(nm^2)\)的. 但对于这种体积全为\(1\)的树上背包,我们可以通过记\(Size\)优化转移时的循环上界,做 ...

  5. [CSP-S模拟测试]:点亮(状压DP+树上背包DP)

    题目传送门(内部题121) 输入格式 第一行,一个正整数$n$. 第二行,$n-1$个正整数$p_2,p_3,...,p_n$.保证$p_u$是在$1$到$u-1$中等概率随机选取的. 接下来$n$行 ...

  6. hdu1059 多重背包(转换为01背包二进制优化)

    题目链接:http://acm.split.hdu.edu.cn/showproblem.php?pid=1059 之前写过一个多重背包二进制优化的博客,不懂请参考:http://www.cnblog ...

  7. HDU4044 GeoDefense(有点不一样的树上背包)

    题目大概说一棵n个结点的树,每个结点都可以安装某一规格的一个塔,塔有价格和能量两个属性.现在一个敌人从1点出发但不知道他会怎么走,如果他经过一个结点的塔那他就会被塔攻击失去塔能量的HP,如果HP小于等 ...

  8. luogu 2014 选课 树上背包

    树上背包 #include<bits/stdc++.h> using namespace std; ; const int inf=0x3f3f3f3f; vector<int> ...

  9. hdu1059 dp(多重背包二进制优化)

    hdu1059 题意,现在有价值为1.2.3.4.5.6的石头若干块,块数已知,问能否将这些石头分成两堆,且两堆价值相等. 很显然,愚蠢的我一开始并想不到什么多重背包二进制优化```因为我连听都没有听 ...

随机推荐

  1. 「学习笔记」FFT 快速傅里叶变换

    目录 「学习笔记」FFT 快速傅里叶变换 啥是 FFT 呀?它可以干什么? 必备芝士 点值表示 复数 傅立叶正变换 傅里叶逆变换 FFT 的代码实现 还会有的 NTT 和三模数 NTT... 「学习笔 ...

  2. JavaScript高级特征之面向对象笔记二

    Prototype 1.  当声明一个函数的时候,浏览器会自动为该函数添加一个属性prototype, 2.  该属性的默认值为{} 3.  可以动态的给prototype增加key和value值 4 ...

  3. python 基础之字符串方法

    字符串 print('chenxi'*8) 测试 D:\python\python.exe D:/untitled/dir/for.py chenxichenxichenxichenxichenxic ...

  4. Linux之用户和用户组总结

    Linux是多用户.多任务操作系统 UID即为用户身份号码,具有唯一性,可通过UID来判断用户身份,有以下几种:UID为0,系统管理员,即root,万能:UID为1-999,系统账号,用于独立执行某些 ...

  5. 【Python数据挖掘】第六篇--特征工程

    一.Standardization 方法一:StandardScaler from sklearn.preprocessing import StandardScaler sds = Standard ...

  6. 我的学习经历——Linux系统入门教程

    我想把最近学习Linux的经验和过程分析出来,当时是在上大三,是学生一枚,以前对开源也没有什么特殊的认识,只觉得很高深,不明觉厉的东西,在当时因为学校要参加职业技能大赛,其中有一团体性质的比赛,几个同 ...

  7. Java 自定义DateUtils

    1 /* Date d = new Date(); String s = DateUtils.DateToString(d, "yyyy-MM-dd HH:mm:ss"); Sys ...

  8. 第1节 Scala基础语法:13、list集合的定义和操作;16、set集合;17、map集合

    list.+:5 , list.::5: 在list集合头部添加单个元素5 : li1.:+(5):在list集合尾部添加单个元素5: li1++li2,li1:::li2:在li1集合尾部添加il2 ...

  9. vue + element ui table表格二次封装 常用功能

    因为在做后台管理项目的时候用到了大量的表格, 且功能大多相同,因此封装了一些常用的功能, 方便多次复用. 组件封装代码: <template> <el-table :data=&qu ...

  10. [经验] 关于 Java 中的非空判断

    在写项目的时候, 遇到一个问题 假设有一个控制层接口为: @ResponseBody @RequestMapping(value = "test", method = Reques ...