\(K-D Tree\),一种用来维护\(K\)维数据的数据结构。常用于维护各种高维的数据,或者是邻近搜索等。从另一种意义上说,实际上就是高维的二叉搜索树。对于一些常见的问题,如\(k\)远点对、三位偏序(在线)等,可以用\(K-DTree\)解决。

那么,\(KDT\)如何建树呢?

观察一下普通的二叉搜索树,发现它的每一个节点都有一个“关键字",用它来划分左右儿子。于是,对于高维的数据,我们考虑分层划分。

比如对于点\((x,y)\),它有两层维度。那么,我们可以在第一层用\(x\)划分,第二层用\(y\)划分,第三层用\(x\)划分,依次迭代。也可以用随机数的方法,随机划分。

对于第\(i\)层维度,我们对它的维度编号是\(i-1\).

接下来考虑如何实现建树。

首先,这个树上得维护一些东西,要不然就没啥意义了。对于一个节点,我们首先要知道它所管辖的区域有哪些。那么对于\(k\)维的数据,我们定义树中维护两个数组:

\(int\) \(mi[k],mx[k]\)来维护每一层它所能维护到的上界和下界。

其次,我们可以用\(siz\)来维护它的子树大小(用于重构),以及题目中要求的信息。

对于区间\([l,r]\),我们依旧是按照套路,将它划分为左右两个区间,并分别递归。

注意选择每个点中管辖的区域中哪个点做根的时候,比较优的是中位数。于是,我们建树的时候,就优先使用中位数来做这个孩子的点,就是所谓这颗子树的\(rt\)点。

那么,怎么找中位数呢?\(k\)维,每一层都做一次\(sort\),那不得炸上天?

这样的复杂度是\(O(knlogn)\)的(一本正经地瞎蒙)

所以我们考虑换一个方式。\(STL\)自然会给我们另一条路的:\(nth\)_\(element\)函数就可以满足我们的需求。

它可以做到对于一个\([l,r]\)的序列,用\(O(n)\)的时间,使得我们所选择的的那个位置\(pos\)上处于合适的数字。但是注意,除了这个位置上,其它位置上没有被排序。

但是我们只需要这么多就够了,不是吗?

用它的时候,别忘了重载一下运算符。

于是,\(build\)建树的代码就呼之欲出了……

int build(int l,int r,int d){
if(l>r)return 0;
int x=++tot,mid=l+r>>1;
D=d;nth_element(p+l,p+mid,p+r+1);
tr[x].c=p[mid];ls[x]=build(l,mid-1,d^1);
rs[x]=build(mid+1,r,d^1);pushup(x);return x;
}

还记得当初学那些什么乱七八糟的平衡树的时候,总会有不平衡的情况。同样地,\(KDT\)也可以支持动态插入,而不平衡也是我们要解决的问题之一。

相信各位听过一句话:优美的暴力(逃)

记得有个东西叫替罪羊树吗,里面有个东东叫重构。我们引入它的概念,来实现\(KDT\)的平衡。

设定平衡因子\(Alpha\),来检测是否不平衡,不平衡则重建。记住,数据维度要对应上。

对于空间,开一个垃圾桶(雾),保存删掉的节点的编号,循环利用一下。

下面给出这部分代码:

inline int New(){
if(top)return rub[top--];
else return ++tot;
}
inline int build(int l,int r,int d){
if(l>r)return 0;
int x=New(),mid=l+r>>1;
D=d;nth_element(p+l,p+mid,p+r+1);
tr[x].c=p[mid];ls[x]=build(l,mid-1,d^1);
rs[x]=build(mid+1,r,d^1);pushup(x);return x;
}
inline void clear(int x,int pos){
if(ls[x])clear(ls[x],pos);
p[pos+tr[ls[x]].siz+1]=tr[x].c;rub[++top]=x;
if(rs[x])clear(rs[x],pos+tr[ls[x]].siz+1);
}
inline void check(int &x,int d){
double C=A*(double)(tr[x].siz);
if(C<(double)(tr[ls[x]].siz)||C<(double)(tr[rs[x]].siz)){
clear(x,0);
x=build(1,tr[x].siz,d);
}
}
inline void Ins(int &x,point p,int d){
if(!x){x=New();ls[x]=rs[x]=0;tr[x].c=p;pushup(x);return;}
if(p.x[d]<=tr[x].c.x[d])Ins(ls[x],p,d^1);
else Ins(rs[x],p,d^1);
pushup(x);check(x,d);
}

里面的\(A\)就是阿尔法。

好了,现在看看它都(干了些什么)能干什么吧。

例题:\(K\)远点对#

求出\(n\)个点中,对于指定点,第\(k\)大的欧氏距离的平方。

这玩意,用一个堆和\(KDT\)结合就好了。

对于第\(k\)大,堆里面\(push\)进\(2k\)个0.因为,对于每个点,我找到的都是不定向的,所以同一个点会两次被搜到。于是,堆要到\(2k\).

对于每一次搜到的答案,和堆顶比较,如果大就放进去,并去掉堆尾,并以每一次的答案去搜索左右子树(没错,它是靠剪枝吃饭哒)

对于一个点到管辖范围的查询……意会即可(雾

#include<cstdio>
#include<iostream>
#include<cstring>
#include<algorithm>
#include<queue>
#include<string>
using namespace std;
#define inf 192608170000000ll
typedef long long ll;
ll read(){
ll x=0,pos=1;char ch=getchar();
for(;!isdigit(ch);ch=getchar()) if(ch=='-') pos=0;
for(;isdigit(ch);ch=getchar()) x=(x<<1)+(x<<3)+ch-'0';
return pos?x:-x;
}
const ll MAXN=2e5+10;
ll n,k;
struct point{
ll x[2];
}p[MAXN];
struct cmp{
ll operator()(ll a,ll b){
return a>b;
}
};
priority_queue<ll,vector<ll>,cmp>q;
struct node{
ll minn[2],maxn[2],siz;
point c;
}tr[MAXN];
ll rt,D,rs[MAXN],ls[MAXN];
ll operator<(point a,point b){return a.x[D]<b.x[D];}
inline void pushup(ll x){
ll l=ls[x],r=rs[x];
tr[x].siz=tr[l].siz+tr[r].siz+1;
for(register int i=0;i<=1;++i){
tr[x].minn[i]=tr[x].maxn[i]=tr[x].c.x[i];
if(l)tr[x].minn[i]=min(tr[x].minn[i],tr[l].minn[i]),tr[x].maxn[i]=max(tr[x].maxn[i],tr[l].maxn[i]);
if(r)tr[x].minn[i]=min(tr[x].minn[i],tr[r].minn[i]),tr[x].maxn[i]=max(tr[x].maxn[i],tr[r].maxn[i]);
}
}
ll tot;
void build(ll &x,ll l,ll r,ll d){
if(l>r)return;
x=++tot;
ll mid=l+r>>1;
D=d;nth_element(p+l,p+mid,p+r+1);
tr[x].c=p[mid];
build(ls[x],l,mid-1,d^1);
build(rs[x],mid+1,r,d^1);
pushup(x);
}
inline ll abs(ll a){return a>0?a:-a;}
ll dis(point a,point b){return (a.x[0]-b.x[0])*(a.x[0]-b.x[0])+(a.x[1]-b.x[1])*(a.x[1]-b.x[1]);}
ll dissqr(point top,ll a){
ll di=0;
for(int i=0;i<=1;++i){
ll nd=0;
if(top.x[i]<tr[a].minn[i])
nd=tr[a].maxn[i]-top.x[i];
else if(top.x[i]>tr[a].maxn[i])
nd=top.x[i]-tr[a].minn[i];
else nd=max(top.x[i]-tr[a].minn[i],tr[a].maxn[i]-top.x[i]);
di+=nd*nd;
}
return di;
}
void query(ll x,point top){
ll di=dis(tr[x].c,top);
if(di>q.top())q.pop(),q.push(di);
ll l=ls[x],r=rs[x],dl,dr;
dl=l?dissqr(top,l):-inf,dr=r?dissqr(top,r):-inf;
if(dl>dr){
if(dl>q.top())query(l,top);
if(dr>q.top())query(r,top);
}
else{
if(dr>q.top())query(r,top);
if(dl>q.top())query(l,top);
}
}
int main(){
n=read(),k=read();
for(int i=1;i<=n;++i)p[i].x[0]=read(),p[i].x[1]=read();
build(rt,1,n,0);
for(int i=1;i<=k+k;++i)q.push(0);
for(int i=1;i<=n;++i)query(rt,p[i]);
printf("%lld\n",q.top());
return 0;
}

讲了一下kdt的重构等,也没多少啊qwq,留几个题吧

\(Luogu-P2479\)

\(Luogu-P4357\)

\(Luogu-P4475\)

\(Luogu-P4169\)

\(Luogu-P4390\)

\(Luogu-P4148\)

\(Luogu-P3769\)

够了不qwq

题解2479

题解4475

题解4148

题解3769

K-DTree入门的更多相关文章

  1. django模型操作

    Django-Model操作数据库(增删改查.连表结构) 一.数据库操作 1.创建model表        

  2. 主席树入门(区间第k大)

    主席树入门 时隔5个月,我又来填主席树的坑了,现在才发现学算法真的要懂了之后,再自己调试,慢慢写出来,如果不懂,就只会按照代码敲,是不会有任何提升的,都不如不照着敲. 所以搞算法一定要弄清原理,和代码 ...

  3. web安全之机器学习入门——3.1 KNN/k近邻

    目录 sklearn.neighbors.NearestNeighbors 参数/方法 基础用法 用于监督学习 检测异常操作(一) 检测异常操作(二) 检测rootkit 检测webshell skl ...

  4. A - 低阶入门膜法 - K-th Number (主席树查询区间第k小)

    题目链接:https://cn.vjudge.net/contest/284294#problem/A 题目大意:主席树查询区间第k小. 具体思路:主席树入门. AC代码: #include<i ...

  5. [机器学习]-K近邻-最简单的入门实战例子

    本篇文章分为两个部分,前一部分主要简单介绍K近邻,后一部分是一个例子 第一部分--K近邻简介 从字面意思就可以容易看出,所谓的K近邻,就是找到某个样本距离(这里的距离可以是欧式距离,曼哈顿距离,切比雪 ...

  6. (数据挖掘-入门-3)基于用户的协同过滤之k近邻

    主要内容: 1.k近邻 2.python实现 1.什么是k近邻(KNN) 在入门-1中,简单地实现了基于用户协同过滤的最近邻算法,所谓最近邻,就是找到距离最近或最相似的用户,将他的物品推荐出来. 而这 ...

  7. 数据挖掘入门系列教程(三)之scikit-learn框架基本使用(以K近邻算法为例)

    数据挖掘入门系列教程(三)之scikit-learn框架基本使用(以K近邻算法为例) 简介 scikit-learn 估计器 加载数据集 进行fit训练 设置参数 预处理 流水线 结尾 数据挖掘入门系 ...

  8. (算法入门经典大赛 优先级队列)LA 3135(之前K说明)

    A data stream is a real-time, continuous, ordered sequence of items. Some examples include sensor da ...

  9. 主席树入门——询问区间第k大pos2104,询问区间<=k的元素个数hdu4417

    poj2104找了个板子..,但是各种IO还可以进行优化 /* 找区间[l,r]第k大的数 */ #include<iostream> #include<cstring> #i ...

  10. Python3入门机器学习 - k近邻算法

    邻近算法,或者说K最近邻(kNN,k-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一.所谓K最近邻,就是k个最近的邻居的意思,说的是每个样本都可以用它最接近的k个邻居来代 ...

随机推荐

  1. codeforces 1262D Optimal Subsequences 主席树询问第k小

    题意 给定长度为\(n\)的序列\(a\),以及m个询问\(<k,pos>\),每次询问满足下列条件的子序列中第\(pos\)位的值为多少. 子序列长度为\(k\) 序列和是所有长度为\( ...

  2. 17_Python的常用模块

    1.随机数模块 random 1.随机小数 import random # (0,1)随机取浮点数 random.random() # 0.17988578778011 # (1, 3)取指定范围的浮 ...

  3. Linux服务器被入侵后的处理过程

    突然,频繁收到一组服务器 ping 监控不可达邮件,赶紧登陆 zabbix 监控系统查看流量状况. 可见流量已经达到了 800M 左右,这肯定不正常了,马上尝试 SSH 登陆系统,不幸的事,由于网络堵 ...

  4. ES6特性整理

    ESMAScript6.0 ES6 兼容 IE10+ .Chrome.Firefox 要想兼容IE10以下的有两种方法: 用 babel 工具 borwer.js ,在 script 标签里添加 ty ...

  5. springboot x.x.x RELEASE不同版本的差异

    springboot 1.x.x RELEASE的 application.properties配置 server.context-path=/ server.port=8080 server.ses ...

  6. C#程序执行时设置刷新等待

    背景 C#在进行某些调用操作时需要隐藏背景,等待刷新. 步骤 1.前端设置 <!--Loading Mask Region--> <div> <div id=" ...

  7. 《SeleniumBasic 3.141.0.0 - 在VBA中操作浏览器》系列文章之一:SeleniumBasic的下载

    Selenium是一种非常流行的浏览器和网页自动化技术,开发人员可以使用C#.Java.Python等语言来操作Chrome.Firefox等浏览器. VBA语言可以直接操作访问Microsoft I ...

  8. 我是如何使用freemarker生成Word文件的?

    推荐:亲身体验,数次踩坑,遂撰写此文,以备各位不时之需. 背景 一天,产品经理递给我了一份word报告,我定睛一看 这个文档有大大小小的标题层级,还有排版好的段落.各种一目了然的饼图.走势图,当然还少 ...

  9. redis加固:修改默认端口6379、密码不为空、内网服务器访问

    一.windows下redis加固: 1.修改redis密码+修改redis端口 1.1.找到服务当中redis的属性配置文件是哪个   这个是我的"D:\Program Files\Red ...

  10. 《C语言进阶剖析》课程目录

    <C语言进阶剖析>学习笔记                                                         本文总结自狄泰软件学院唐佐林老师的<C语言 ...