Johnson–Lindenstrauss 定理是这样的:一个一百万维空间里的随便一万个点,一定可以几乎被装进一个几十维的子空间里! 严格说来是这样:在 M 维空间中的 N 个点,几乎总是被包含在一个 D 维子空间里的.这里的 D 按照直觉应当等于 N 的阶,可是实际上我们只需要让 D 是 log(N) 的阶就可以了.这里「几乎被包含在」的确切含义是它在这个子空间上的投影几乎是等距的(允许有一个 ε 的误差,而常数 D/log(N) 就依赖于 ε).很显然,这件事情在高维数据降维时有极重要的意义…
根据DSqiu的blog整理出来 :http://dsqiu.iteye.com/blog/1689163 PS:模板是自己写的,如有错误欢迎指出~ 本文内容框架: §1 Dijkstra算法 §2 Bellman-Ford算法 §3 Floyd-Warshall算法 §4 Johnson算算法 §5 问题归约 §0 小结 常用的最短路径算法有:Dijkstra算法.Bellman-Ford算法.Floyd-Warshall算法.Johnson算法 最短路径算法可以分为单源点最短路径和全源最短路…
Latex中定义.定理.引理.证明 设置方法总结 在LaTex中需要有关定理.公理.命题.引理.定义等时,常用如下命令 \newtheorem{定理环境名}{标题}[主计数器名] \newtheorem{theorem}{Theorem}[Chapter] 意思就是定义一个以Theorem为标题的theorem环境,计数以章节数为主. \begin{theorem}[均值不等式] 设$A,B$是两个实数, 则$2AB\leq 2 A^2+B^2$. \end{theorem} 如果需要输出中文,…
Theorem:定理.是文章中重要的数学化的论述,一般有严格的数学证明. Proposition:可以翻译为命题,经过证明且interesting,但没有Theorem重要,比较常用. Lemma:一种比较小的定理,通常lemma的提出是为了来逐步辅助证明Theorem,有时候可以将Theorem拆分成多个小的Lemma来逐步证明,以使得证明的思路更加清晰.很少情况下Lemma会以其自身的形式存在. Corollary:推论,由Theorem推出来的结论,通常我们会直接说this is a co…
Johnson–Lindenstrauss 引理表明任何高维数据集均可以被随机投影到一个较低维度的欧氏空间,同时可以控制pairwise距离的失真. 理论边界 由一个随机投影P所引入的失真是确定的,这是由于p定义了一个esp-embedding.其概率论定义如下: u和v是从一个形状是[n样例,n特征]=[n_samples, n_features]的数据集中的任意行,p室友一个形状是[n成分,n特征]=[n_components, n_features]的随机高斯N(0,1)矩阵的投影(或一个…
一.摘要 最紧邻检索:一种树基于树结构,一种是基于hash a.随机投影算法,需要产生很多哈希表,才能提高性能. b.基于学习的哈希算法在哈希编码较短时候性能不错,但是增加编码长度并不能显著提高性能. 随机投影:实际上就是随机的,实际上需要挖掘使用数据的内部结构,结合最大熵原理. 基于密度的哈希就是依据数据分布产生最合理的投影. 数据稀疏:稀疏编码+ 压缩感知 GIST1M数据集2.55G,这个是专门做最近邻检索的. 二.绪论 2.1 课题背景 最近邻检索的主要问题是如何建立高效索引. 数据集是…
1. NLP问题简介 0x1:NLP问题都包括哪些内涵 人们对真实世界的感知被成为感知世界,而人们用语言表达出自己的感知视为文本数据.那么反过来,NLP,或者更精确地表达为文本挖掘,则是从文本数据出发,来尽可能复原人们的感知世界,从而表达真实世界的过程.这里面就包括如图中所示的模型和算法,包括: ()文本层:NLP文本表示: ()文本-感知世界:词汇相关性分析.主题模型.意见情感分析等: ()文本-真实世界:基于文本的预测等: 显而易见,文本表示在文本挖掘中有着绝对核心的地位,是其他所有模型建构…
1. NLP问题简介 0x1:NLP问题都包括哪些内涵 人们对真实世界的感知被成为感知世界,而人们用语言表达出自己的感知视为文本数据.那么反过来,NLP,或者更精确地表达为文本挖掘,则是从文本数据出发,来尽可能复原人们的感知世界,从而表达真实世界的过程.这里面就包括如图中所示的模型和算法,包括: ()文本层:NLP文本表示: ()文本-感知世界:词汇相关性分析.主题模型.意见情感分析等: ()文本-真实世界:基于文本的预测等: 显而易见,文本表示在文本挖掘中有着绝对核心的地位,是其他所有模型建构…
Java领域有很多著名的人物,他们为Java社区编写框架.产品.工具或撰写书籍改变了Java编程的方式.本文是<最受欢迎的8位Java牛人>的2.0版本. PS:排名不分先后.本文的信息整理自网络博客,信息的真实性未经过严格筛选和确认. 1.James Duncan Davidson —— Tomcat . Ant 他曾是一名软件工程师,现在是一名摄影师. 1970年7月29日,James Duncan Davidson出生于德州Lubbock. 1997至2001年,Davidson担任Su…
<?xml version="1.0" encoding="UTF-8"?> <?import javafx.scene.Scene?> <?import javafx.scene.layout.*?> <?import javafx.scene.control.*?> <?import javafx.scene.control.cell.PropertyValueFactory?> <?import…
面是8位Java牛人,他们为Java社区编写框架.产品.工具或撰写书籍改变了Java编程的方式. P.S 以下排名纯属个人喜好. 1. Tomcat & Ant创始人 James Duncan Davidson,当他还是Sun公司 (1997–2001)的一名软件工程师时创立了基于Java的Web服务器Tomcat.直到现在Tomcat 仍然被用于很多Java Web项目.此外他还编写了Ant构建工具,采用XML描述构建过程和依赖管理成为了构建基于Java Web程序的实际标准. 相关链接 Ja…
Java领域有非常多著名的人物,他们为Java社区编写框架.产品.工具或撰写书籍改变了Java编程的方式. 本文是<最受欢迎的8位Java牛人>的2.0版本号. PS:排名不分先后.本文的信息整理自网络博客,信息的真实性未经过严格筛选和确认. 1.James Duncan Davidson -- Tomcat . Ant 他曾是一名软件project师,如今是一名摄影师. 1970年7月29日,James Duncan Davidson出生于德州Lubbock. 1997至2001年.Davi…
development test set Note: images displayed are original (non-aligned/funneled) images. match pairs   mismatch pairs Abdullah Gul, 13 Abdullah Gul, 14   AJ Lamas, 1 Zach Safrin, 1 Abdullah Gul, 13 Abdullah Gul, 16   Aaron Guiel, 1 Reese Witherspoon,…
development training set Note: images displayed are original (non-aligned/funneled) images. match pairs   mismatch pairs Aaron Peirsol, 1 Aaron Peirsol, 2   AJ Cook, 1 Marsha Thomason, 1 Aaron Peirsol, 3 Aaron Peirsol, 4   Aaron Sorkin, 2 Frank Solic…
Java领域有非常多著名的人物.他们为Java社区编写框架.产品.工具或撰写书籍改变了Java编程的方式. 本文是<最受欢迎的8位Java牛人>的2.0版本号. PS:排名不分先后.本文的信息整理自网络博客,信息的真实性未经过严格筛选和确认. 1.James Duncan Davidson -- Tomcat . Ant 他曾是一名软件project师.如今是一名摄影师. 1970年7月29日,James Duncan Davidson出生于德州Lubbock. 1997至2001年,Davi…
Java_并发编程培训 java并发程序设计教程 JUC Exchanger 一.概述 Exchanger 可以在对中对元素进行配对和交换的线程的同步点.每个线程将条目上的某个方法呈现给 exchange 方法,与伙伴线程进行匹配,并且在返回时接收其伙伴的对象.Exchanger 可能被视为 SynchronousQueue的双向形式.Exchanger 可能在应用程序(比如遗传算法和管道设计)中很有用. 二.算法描述 基本想法是维护一个槽指向一个结点,结点包含一个准备提供(出去)的item和一…
本文由 ImportNew - 唐尤华 翻译自 javatyro.如需转载本文,请先参见文章末尾处的转载要求. 下面是8位Java牛人,他们为Java社区编写框架.产品.工具或撰写书籍改变了Java编程的方式. P.S 以下排名纯属个人喜好. 1. Tomcat & Ant创始人 James Duncan Davidson,当他还是Sun公司 (1997–2001)的一名软件工程师时创立了基于Java的Web服务器Tomcat.直到现在Tomcat仍然被用于很多Java Web项目.此外他还编写…
第三节课的内容.这节课上课到半截困了睡着了,看着大家都很积极请教认真听讲,感觉很惭愧.周末不能熬太晚.这个博客就记录一下醒着时候听到的内容. Motivation 目前的时代需要处理的数据量维度可能很高,比如1024*960分辨率的图片转化成向量维度就是100万左右.对于当代搜索引擎需要处理的数据更是如此,大数据时代已经来临. 而我们直到,对于普通的对比信息检索,时间复杂度为$O(n)$,当然,如果加上维度$D$,数据检索复杂度变成了$O(Dn)$,要知道这里的D很大,属于高纬度数据,甚至远大于…
Lesson 12 Life on a desert island desert island ['dezət 'ailənd] n. 荒岛 uninhabited island coral island volcanic island archipelago the Indonesian archipelago peninsula the Korean peninsula paradise ['pæ rədaɪs] n. 天堂,伊甸园 heaven the Garden of Eden Haw…
目录 配置 TeXlive 论文模板 TeXstudio 写作 特殊环境 算法 定理.定义 编译 可能出现的问题 参考文献 缺少volume 学位论文 配置 TeXlive 下载了最新的texlive2017.由于下载安装工具,再由安装工具从网上下载镜像的方法经常半路停止,可能由于网络问题,所以找了一个直接下载镜像的方法.下载镜像地址和安装见这个网站. 论文模板 学校的毕业论文模板是seuthesis,但是缺乏维护,由于texlive的更新而seuthesis没有更新,所以找了好几个模板都不能用…
解决单源最短路径问题(Single Source Shortest Paths Problem)的算法包括: Dijkstra 单源最短路径算法:时间复杂度为 O(E + VlogV),要求权值非负: Bellman-Ford 单源最短路径算法:时间复杂度为 O(VE),适用于带负权值情况: 对于全源最短路径问题(All-Pairs Shortest Paths Problem),可以认为是单源最短路径问题的推广,即分别以每个顶点作为源顶点并求其至其它顶点的最短距离.例如,对每个顶点应用 Bel…
1.问题描述:     n个作业{1,2,…,n}要在由2台机器M1和M2组成的流水线上完成加工.每个作业加工的顺序都是先在M1上加工,然后在M2上加工.M1和M2加工作业i所需的时间分别为ai和bi.流水作业调度问题要求确定这n个作业的最优加工顺序,使得从第一个作业在机器M1上开始加工,到最后一个作业在机器M2上加工完成所需的时间最少.     2.问题分析 直观上,一个最优调度应使机器M1没有空闲时间,且机器M2的空闲时间最少.在一般情况下,机器M2上会有机器空闲和作业积压2种情况.设全部作…
#include<iostream> #include<cstdio> #include<cstring> #include<algorithm> using namespace std; ],a[],b[],sum,ti[]; struct node//三元组结构 { int o;//工作编号 int t;//时间 int ab;//在哪个机器 }job[]; int cmp(const node &x,const node &y) { r…
题目链接:http://www.51nod.com/onlineJudge/questionCode.html#!problemId=1205 题意:中文题诶- 思路:johnson模板题 流水作业调度问题的Johnson算法: (1)令N1={i|ai<bi}, N2={i|ai>=bi}: (2)将N1中作业按ai的非减序排序:将N2中作业按bi的非增序排序: (3)N1中作业接N2中作业构成满足Johnson法则的最优调度. 关于johnson算法详细讲解:http://blog.csd…
你可能正在想“Spring不过是另外一个的framework”.当已经有许多开放源代码(和专有)J2EEframework时,我们为什么还需要Spring Framework? Spring是独特的,因为若干个原因: 它定位的领域是许多其他流行的framework没有的.Spring致力于提供一种方法管理你的业务对象. Spring是全面的和模块化的.Spring有分层的体系结构,这意味着你能选择使用它孤立的任何部分,它的架构仍然是内在稳定的.因此从你的学习中,你可得到最大的价值.例如,你可能选…
Spring Framework创始人,著名作者. Rod在悉尼大学不仅获得了计算机学位,同时还获得了音乐学位.更令人吃惊的是在回到软件开发领域之前,他还获得了音乐学的博士学位. 有着相当丰富的C/C++技术背景的Rod早在1996年就开始了对Java服务器端技术的研究.他是一个在保险.电子商务和金融行业有着丰富经验的技术顾问,同时也是JSR-154(Servlet2.4)和JDO2.0的规范专家.JCP的积极成员,是Java development community中的杰出人物. 个人经历…
Johnson算法 请不要轻易点击标题 一个可以在有负边的图上使用的多源最短路算法 时间复杂度\(O(n \cdot m \cdot log \ m+n \cdot m)\) 空间复杂度\(O(n+m)\) 这个神奇的算法综合利用了Dijkstra算法和Bellman-Ford算法(不要慌,虽然有负边但Dijkstra可以跑!) 在开始讲解之前,我们将其与floyd进行比较 \(floyd:\) ​ 时间复杂度\(O(n^3)\) ​ 空间复杂度\(O(n^2)\) ​ 可以看出,\(floyd…
题目链接 题意 : 在一个 n * m 的矩阵中放置 {0, 1, 2} 这三个数字.要求 每个元素 A(i, j) <= A(i+1, j) && A(i, j) <= A(i, j+1) .问你合法的构造方案有多少种 分析 : 分析一下限制条件不难得出.其实就是在矩阵中设置两条分界线 使得分界线总左上角到右下角分别是 0.1.2 例如如下的矩阵就是合法的 0 0 1 2 0 1 2 2 1 2 2 2 那么问题就转化成了在矩阵中找出两条可重叠的路径 把矩阵分成三个部分 有一…
\(Johnson\)算法学习笔记. 在最短路的学习中,我们曾学习了三种最短路的算法,\(Bellman-Ford\)算法及其队列优化\(SPFA\)算法,\(Dijkstra\)算法.这些算法可以快速的求出单源最短路,即一个源点的最短路. 而\(Floyd\)算法,这个及其简短的算法,可以以\(O(n^3)\)的复杂度算出任意一对点之间的最短路. 我们发现,\(floyd\)算法的时间复杂度和边的数量没有多大的关系,也就是说,\(floyd\)使用的最优条件是稠密图. 那么问题来了,如果我们面…
前提说明,因为我比较菜,关于理论性的证明大部分是搬来其他大佬的,相应地方有注明. 我自己写的部分换颜色来便于区分. 邻项交换对比是求一定条件下的最优排序的思想(个人理解).这部分最近做了一些题,就一起归纳一下. [P1080国王游戏] 题目描述 恰逢 HH国国庆,国王邀请nn 位大臣来玩一个有奖游戏.首先,他让每个大臣在左.右手上面分别写下一个整数,国王自己也在左.右手上各写一个整数.然后,让这 nn 位大臣排成一排,国王站在队伍的最前面.排好队后,所有的大臣都会获得国王奖赏的若干金币,每位大臣…