Hosts Russia got the World Cup off to a flying start by hammering Saudi Arabia 5-0 in the opening game in Moscow.Fears that Russia may become just the second host nation to fail to qualify from the group stages have been quashed for now, but their ne…
Today I troubleshooted an Elasticsearch-cluster-down issue. Several lessons were learned: When many elasticsearch cluster nodes are restarted, to avoid HEAP spike, better to temporarily stop all connection attempts; Avoid setting allow_primary=true w…
Lessons learned from manually classifying CIFAR-10 Apr 27, 2011 CIFAR-10 Note, this post is from 2011 and slightly outdated in some places. Statistics. CIFAR-10 consists of 50,000 training images, all of them in 1 of 10 categories (displayed left). T…
What we learned in Seoul with AlphaGo March 16, 2016 Go isn’t just a game—it’s a living, breathing culture of players, analysts, fans, and legends. Over the last 10 days in Seoul, South Korea, we’ve been lucky enough to witness some of that incredibl…
翻译 | Improving Distributional Similarity with Lessons Learned from Word Embeddings 叶娜老师说:"读懂论文的最好方法是翻译它".我认为这是很好的科研训练,更加适合一个陌生领域的探索.因为论文读不懂,我总结无非是因为这个领域不熟悉.如果是自己熟悉的领域,那么读起来肯定会比较顺畅. 原文 摘要 [1] Recent trends suggest that neural-network-inspired wor…
17年的旧文,最近因为SageDB论文而重读. 文章主要思路是通过学习key的顺序.结构等来预测record在位置.存在与否等.效果方面,据称部分场景下,相对b-tree可以优化70%的内存占用. 最大价值其实在于使用ML来优化(索引)系统这个新的方向. Range Index 审视下btree查找完成的功能:输入一个key,每次选出一个可能的范围(分支节点),直到最后命中(叶子节点).这其实跟ML中模型类似. 换句话说,若能估算出数据的累积分布(记作F),那么查询key所在位置,也可以看成是…
Lessons Learned from Developing a Data Product For an assignment I was asked to develop a visual ‘data product’ that informed decisions on video game ratings taking as an indicator their ranking on the MetaCritic site. I decided to use RStudio’s Shin…
原文:http://googleresearch.blogspot.jp/2010/04/lessons-learned-developing-practical.html Lessons learned developing a practical large scale machine learning system Tuesday, April 06, 2010 Posted by Simon Tong, Google Research When faced with a hard pre…
TILDE: A Temporally Invariant Learned DEtector Yannick Verdie1,∗ Kwang Moo Yi1,∗ Pascal Fua1 Vincent Lepetit2 作者基于LeNet-5 网络设计一个用于特征点检测的框架. 框架结构: 输入:图像块(image patch) 处理:神经网络-卷积,池化,全连接 输出:一个回归值 对于整张图像需要裁剪成不同小块(patch)送入网络,从而得到该图像的特征点响应值,如下图所示: 最终根据响应值来…
26 THINGS I LEARNED IN THE DEEP LEARNING SUMMER SCHOOL In the beginning of August I got the chance to attend the Deep Learning Summer School in Montreal. It consisted of 10 days of talks from some of the most well-known neural network researchers. Du…
I go to the gym and lift weights because I like the feeling of getting stronger and better. Two months ago, I started to feel a throbbing pain in my knees, yet I continued to go to the gym. I wanted so badly to keep getting stronger that I neglected…
Real-time Multiple People Tracking with Deeply Learned Candidate Selection and Person Re-identification 2019-06-21 15:45:11 Paper: https://arxiv.org/abs/1809.04427 Code: https://github.com/longcw/MOTDT 1. Background and Motivation:  多目标跟踪的核心思想是数据连接(d…
此部分是计算机视觉部分,主要侧重在底层特征提取,视频分析,跟踪,目标检测和识别方面等方面.对于自己不太熟悉的领域比如摄像机标定和立体视觉,仅仅列出上google上引用次数比较多的文献.有一些刚刚出版的文章,个人非常喜欢,也列出来了. 33. SIFT关于SIFT,实在不需要介绍太多,一万多次的引用已经说明问题了.SURF和PCA-SIFT也是属于这个系列.后面列出了几篇跟SIFT有关的问题.[1999 ICCV] Object recognition from local scale-invar…
此部分是计算机视觉部分,主要侧重在底层特征提取,视频分析,跟踪,目标检测和识别方面等方面.对于自己不太熟悉的领域比如摄像机标定和立体视觉,仅仅列出上google上引用次数比较多的文献.有一些刚刚出版的文章,个人非常喜欢,也列出来了. 33. SIFT关于SIFT,实在不需要介绍太多,一万多次的引用已经说明问题了.SURF和PCA-SIFT也是属于这个系列.后面列出了几篇跟SIFT有关的问题.[1999 ICCV] Object recognition from local scale-invar…
I learned this trick from hitonanode's submission on AtCoder. The trick is like struct fast_ios { fast_ios(){ cin.tie(0); ios::sync_with_stdio(false); cout << fixed << setprecision(20); }; } fast_ios_; What I used to do is like #define FAST_RE…
A Discriminatively Learned CNN Embedding for Person Re-identification Zheng Z, Zheng L, Yang Y. A Discriminatively Learned CNN Embedding for Person Re-identification[J]. Acm Transactions on Multimedia Computing Communications & Applications, 2017, 14…
3. MACHINE LEARNED RANKING 1) 完全使用不好的数据去训练模型不可行,因为负面结果不可能覆盖到所有方面: 2) 搜索可以看做是个二分问题,在此实验中,我们使用gradient boosting trees(GBDT) with logistic loss,该方法可以用来减少首页出现的bad urls - 该方法首先确定urls与给定query相关与否的分界线(logistic loss): 而后在模型中加入Perfect.Excellent.Good的信息去区分urls…
Are we ready for learned Cardinality Estimation 摘要 文章包括三大部分: 对于一个静态的数据库,本文将五种基于学习的基数估计方法与九中传统的基数估计方法在四个现实世界的数据集和统一的工作负载上进行了比较.结果说明基于学习的基数估计方法比传统方法更加准确,但也需要更多训练和推理的开销. 探索在动态的数据库中,基于学习的基数估计方法是否能够表现出色,结果证明基于学习的基数估计方法不能很好的实时的捕捉到数据的更新,经常会产生一些较大的误差,而在更新环境不…
Tsunami: A Learned Multi-dimensional Index for Correlated Data and Skewed Workloads 论文解读(VLDB 2021) 本篇博客是对发表在2021 VLDB上的# Tsunami: A Learned Multi-dimensional Index for Correlated Data and Skewed Workloads的解读,原文链接为Tsunami: A Learned Multi-dimensional…
代码地址:postgresql-13.1-ml: Integration of CardEst Methods into PostgreSQL by HTTP Server (github.com) 当前进度:可以支持单表查询的基数估计模块的替换.至于多表join的基数估计模块替换还在开发中 注意:本文的重点在于PG的修改.记录一下我的修改思路. 整体流程 PG作为http客户端,向基数估计服务端发送http请求.内容为需要基数估计的sql语句. 基数估计服务端返回该语句的selectivity…
问题/现象: 业务信息流转的某些环节,会向相关人员发送通知邮件,邮件中附带有链接,供相关人员进入察看或处理业务.客户要求邮件中的链接,需要进行限制,只有特定人员才能进入处理或察看.总管想了想,应道没问题,不一会儿就改好了,在业务信息的查询方法中添加了限制——非处理人不得进入.测试这边,忙得脚不沾地,一人扛了两个项目的测试,但还是按照预先设计的测试用例,对该修改进行了测试,测试结果ok,非处理人通过邮件链接进入后,确实提示了“你没有权限,翻滚着离去吧”. 当晚发布生产后,客户一封邮件甩过来:管理员…
今天想学学PM的技能, 打开了百度脑图的网站, 看到中间那个按键的hover效果蛮好看, 遂学习一下. 效果如下: Demo 其实就是利用:before绘制了半透明白色的遮罩, 平时用transform: scale(0, 1)隐藏掉, :active时恢复到transform: scale(1, 1). 另外学到的一点就是按键按下时的缩小效果. 之前自己还在想如何确保缩小之后也是水平竖直居中的, 但是这个demo的实现方法很简单: transform: scale(0.95). 很好用. 看来…
最近,中兴ZTE违反美国商务部禁令,向伊朗出售敏感技术,被美国下达长达7年的禁止令,教训十分深刻.以诚待人,信守承诺,才能在商业社会站稳脚跟. 还是说说最近自己上的一课吧.上了港台服以后,奇奇怪怪的问题比较多.其中之一是玩家被异常登录了.现象是玩家登录游戏,提示账号被异常登录.这种现象本来应该在玩家顶号操作时,被顶号的设备上出现的.不应该在正在登录的活跃客户端上显示 回顾现在的登录过程,玩家连上游戏后,首先会创建一个session.登录完成后,会产生user挂在session上.最后,会找到对应…
1.web性能测试工具:LoadRunner:2.web自动化测试工具:selenium QTP:3.安全性测试工具:AppScan4.缺陷管理工具:TestLink+Mantisbt5..抓包工具:fiddler6.移动android性能测试工具:GT7.app自动化工具:appium.uiautomator.instruments8.web压力测试工具:jmeter9.单元测试工具:Robolectric 自动化测试框架  macaca(支付宝) cafe(百度QA) 快速模拟器:Genym…
http://marcgg.com/blog/2014/04/09/phonegap-steroids-hybrid-native-app-tips/…
Link of the Paper: https://arxiv.org/abs/1609.06647 A Correlative Paper: Show and Tell: A Neural Image Caption Generator (Link of the Paper: https://arxiv.org/abs/1411.4555) Main Points ( Improvements Over the CVPR2015 Model  ): Image Model Improveme…
http://karpathy.github.io/2014/09/02/what-i-learned-from-competing-against-a-convnet-on-imagenet/…
最近正在研究行人检测,学习了一篇2014年发表在ECCV上的一篇综述性的文章,是对行人检测过去十年的一个回顾,从dataset,main approaches的角度分析了近10年的40多篇论文提出的方法,发现有三种方法(DPM变体,Deep networks,Decision forests)都取得了相似的最好结果,并总结了feature,additional data以及context information等对于detection quality的影响. 1.Introduction 行人检…
翻译 HPatches:手工和学习本地描述符的基准和评估——http://tongtianta.site/paper/8979 摘要:在本文中,我们提出了一个评估本地图像描述符的新基准.我们证明现有数据集和评估协议没有明确指出评估的所有方面,导致文献中报告的结果含糊不清和不一致.此外,由于最近通过从大注释数据集中学习它们而获得的局部描述符的改进,这些数据集几乎饱和.因此,我们引入了一个适用于训练和测试现代描述符的新的大型数据集,以及在匹配,检索和分类等几个任务中严格定义的评估协议.这允许在不同的…
最近正在研究行人检测,学习了一篇2014年发表在ECCV上的一篇综述性的文章,是对行人检测过去十年的一个回顾,从dataset,main approaches的角度分析了近10年的40多篇论文提出的方法,发现有三种方法(DPM变体,Deep networks,Decision forests)都取得了相似的最好结果,并总结了feature,additional data以及context information等对于detection quality的影响. 1.Introduction 行人检…