虽然我是程序员,但这里只介绍人类的思维方法. 这个方法我是从这里看到的: https://www.learn-sudoku.com/visual-elimination.html Most people try to solve Sudoku puzzles by picking a random empty cell and trying to figure out what goes in it. Unless you get lucky, this ends up being frustr…
这是一篇被ICLR 2019 接收的论文.论文讨论了如何利用场景先验知识 (scene priors)来定位一个新场景(novel scene)中未曾见过的物体(unseen objects).举例来说,在「厨房」这一场景中,有一张图片显示「苹果」在冰箱的储物架上,同为水果的物体,如「橙子」,会出现在场景的哪个位置呢?论文提出了用基于强化学习的方法来定位「橙子」. 论文:VISUAL SEMANTIC NAVIGATION USING SCENE PRIORS 论文作者:Wei Yang , X…
阅读目录: 概述 toast通知的结构 视觉区域(Visual) 行为(Actions) 特定场景下的Toast通知 带多内容的通知 带行为的通知(例子1) 带行为的通知(例子2) 带文本输入框和行为的通知(例子1) 带文本输入框和行为的通知(例子2) 带下拉框输入和行为的通知 提醒通知 前后台激活的例子 <visual>和<audio>的Schema <actions>的Schema 系统行为的附加行为 Windows10的自适应和交互式toast通知是一个新特性.它…
× 目录 [1]布局视口 [2]视觉视口 [3]理想视口[4]meta标签[5]总结 前面的话 在CSS标准文档中,视口viewport被称为初始包含块.这个初始包含块是所有CSS百分比宽度推算的根源,它给CSS布局限制了一个最大宽度.在桌面上,视口的宽度和浏览器窗口的宽度一致.而在移动端,视口分为布局视口(layout viewport).视觉视口(visual viewport)和理想视口(ideal viewport) 布局视口 移动端设备的问题是,如果使视口的宽度和浏览器窗口宽度一样会导…
viewport:视口,视觉窗口,显示区域.在显示面积上手机屏幕相对桌面显示器要小很多,在几年前(现在也如此)大部分网站都是为桌面显示器浏览而设计,很少考虑到适应手机屏幕,所以如果用手机浏览大多网站时会出现问题,比如常见固定宽度的网页会出现横向竖向滑动条,当然这不算什么大问题:但如果是浏览流动布局的网页那情况会非常糟糕,设想一个宽度为30%的侧边栏对于320px手机屏幕而言也就96px,只能容纳8个12px的汉字,可阅读性非常差.为了让手机也能获得良好的网页浏览体验,Apple找到了一个办法:在…
Web交互设计优化的简易check list 00 | 时间: 2011-02-11 | 28,842 Views 交互设计, 用户研究   “优化已有产品的体验”,这是用户体验相关岗位职责中常见的描述.我们的产品常常是在快速的迭代过程中不断完善的,就像孩子生下来需要养育才能长大一样,优化已有功能/产品,和设计新功能/产品同样重要,不可偏废. 但是,相比实现新功能,已有功能的优化总是显得没有那么紧迫而且很零散,导致了迭代优化的计划总是被归入“重要不紧急”甚至是“不重要不紧急”的象限,变成了东一棒…
X Window 程式设计 转   http://www.cppblog.com/zmj/archive/2007/05/18/24331.html X Window 程式设计 X Window 程式设计入门 http://cnpa.yzu.edu.tw/~thinker 作者:李圭烽 (Thinker; Thinker.bbs@bbs.yzu.edu.tw) (2001-06-01 17:04:00) ----------------------------------------------…
Attention For Fine-Grained Categorization Google ICLR 2015 本文说是将Ba et al. 的基于RNN 的attention model 拓展为受限更少,或者说是非受限的视觉场景.这个工作和前者很大程度上的不同在于,用一个更加有效的视觉网络,并且在attention RNN之外进行视觉网络的预训练. 前人的工作在学习 visual attention model 时已经解决了一些计算机视觉问题,并且表明加上不同的attention mec…
前言:本文是在下的在学习ZK官方文档时整理出来的初稿.本来里面有很多的效果图片和图片代码的.奈何博客园中图片不能粘贴上去,所以感兴趣的筒子们就将就吧.内容中,如有不好的地方,欢迎斧正! ZK框架的分析与应用 1 ZK框架的引入 1.1 概述 ZK是一套以 AJAX/XUL/Java 为基础的网页应用程序开发框架,用于丰富网页应用程序的使用界面.最大的好处是,在设计AJAX网络应用程序时,轻松简便的操作就像设计桌面程序一样. ZK包含了一个以AJAX为基础.事件驱动(event-driven).高…
开篇之前说点别的,马上年终了,好希望年终奖大大的,但是好像这次项目的展示很重要,所以这几天绷得比较近,但是真的没有感觉烦,就是害怕来不及.所以抓紧了.下面直接正题.说一下用到的东西,都是Google搜索来的,但是这些技术真的能用到自己的项目中,自己做的东西等过年回家没事慢慢总结,现在先学习一下别人的东西,也算作一个笔记吧. 我需要在窗体上进行图片的绘制,但是在实际的测试中发现了问题,那就是重绘的时候会发生闪烁,这个问题在初学C语言的课程中也遇到过,在程序绘制动画的高频率刷新的时候,也会产生闪烁,…
Neural activities in V1 create a bottom-up saliency map 本文证明了人类的初级视皮层可以在视觉信息加工的非常早期阶段,生成视觉显著图,用以引导空间选择性注意的分布.这一发现挑战了传统注意理论,相关成果公布在神经科学注明期刊Neuron杂志上. 文章的通讯作者是北京大学感知与智能教育部重点实验室方方教授,第一作者是心理学系博士生张喜淋.研究合作者包括伦敦大学学院(University College London)李兆平教授和中科院生物物理所周…
在上一篇文章中图像检索(2):均值聚类-构建BoF中,简略的介绍了基于sift特征点的BoW模型的构建,以及基于轻量级开源库vlfeat的一个简单实现. 本文重新梳理了一下BoW模型,并给出不同的实现. 基于OpenCV的BoW实现 BoWTrainer的使用 词袋模型开源库DBoW3 BoW BoW模型最初是为解决文档建模问题而提出的,因为文本本身就是由单词组成的.它忽略文本的词序,语法,句法,仅仅将文本当作一个个词的集合,并且假设每个词彼此都是独立的.这样就可以使用文本中词出现的频率来对文档…
在上一节.我们已经介绍了使用HOG和SVM实现目标检测和识别,这一节我们将介绍使用词袋模型BOW和SVM实现目标检测和识别. 一 词袋介绍 词袋模型(Bag-Of-Word)的概念最初不是针对计算机视觉的,但计算机视觉会使用该概念的升级.词袋最早出现在神经语言程序学(NLP)和信息检索(IR)领域,该模型忽略掉文本的语法和语序,用一组无序的单词来表达一段文字或者一个文档. 我们使用BOW在一系列文档中构建一个字典,然后使用字典中每个单词次数构成向量来表示每一个文档.比如: 文档1:I like…

AGV

AGV AGV是(Automated Guided Vehicle)的缩写,意即“自动导引运输车”,是指装备有电磁或光学等自动导引装置,它能够沿规定的导引路径行驶,具有安全保护以及各种移载功能的运输车,AGV属于轮式移动机器人(WMR――Wheeled Mobile Robot)的范畴.   AGV主要三项技术:铰链结构.发动机分置技术和能量反馈.   无人搬运车(Automated Guided Vehicle,简称AGV),指装备有电磁或光学等自动导引装置,能够沿规定的导引路径行驶,具有安全…
Qt Quick简介: Qt Quik 是一种高级用户界面技术,使用它可以轻松地创建供移动和嵌入式设备使用到动态触摸式界面和轻量级应用程序:Qt Quick主要由三部份组成: 改进的Qt Creator IDE(其中包含了Qt Quick设计器)  ----   可以通过拖动界面组件的图形化方式创建QML界面: 新增的简单易学的QML语言                                      ----    一种基于JavaScript拓展的用来描述应用程序用户界面的声明式语…
移动端开发中,有一些基本概念需要理解清楚,才能更好的组织编程逻辑.在刚接触时,移动端视口的缩放和rem单位的缩放搞混淆了,弄得自己很蒙圈.所以仔细总结下自己的理解. 移动端的适配,我理解为两点: 第一点就是视口的缩放配置,牵扯出视口和像素等概念.目的是为让我们的CSS样式中逻辑像素匹配到手机终端的物理像素,让网页视图适合手机屏幕.虽然在代码中只是一个语句就解决的问题,但要理解它,要弄懂很多概念.<关于像素Pixel历史的详解看下一篇文档> 第二点就是rem单位的使用,目的是为了我们只需要一份代…
背景 学术界一直困惑的点是"如何让看似黑盒的CNN模型说话",即对它的分类结果给出解释. 这里的解释是指,让模型告诉我们它是通过图片的哪些像素做出判断的,并不是深度学习理论层面的解释. 反卷积和导向反向传播 CNN模型的可解释问题,很早就有人在研究了,严格来说只是"CNN可视化".有两个经典的方法. CNN中的卷积.反卷机和反池化 反卷机(Deconvolution).上采样(Unsampling).上池化(Unpooling) UnPooling的过程,特点是在M…
http://bindog.github.io/blog/2018/02/10/model-explanation/ http://www.sohu.com/a/216216094_473283 https://jacobgil.github.io/deeplearning/class-activation-maps https://github.com/keras-team/keras/issues/8447 凭什么相信你,我的CNN模型?(篇一:CAM和Grad-CAM) 0x00 背景 在…
http://blog.csdn.net/u014568921/article/details/52518587 图像相似性搜索的原理 BOW 原理及代码解析 Bag Of Visual Words 三大步 OpenCV应用----BOW篇 Bag of Word闲谈 论文提要“Visual Categorization with Bags of Keypoints” Bag of Features (BOF)图像检索算法 老司机带你检测相似图片 哈希算法:均值~.感知~(DCT).差异~ ba…
概述 前面的练习中,解决了一些有关低分辨率图像的问题,比如:小块图像,手写数字小幅图像等.在这部分中,我们将把已知的方法扩展到实际应用中更加常见的大图像数据集. 全联通网络 在稀疏自编码章节中,我们介绍了把输入层和隐含层进行“全连接”的设计.从计算的角度来讲,在其他章节中曾经用过的相对较小的图像(如在稀疏自编码的作业中用到过的 8x8 的小块图像,在MNIST数据集中用到过的28x28 的小块图像),从整幅图像中计算特征是可行的.但是,如果是更大的图像(如 96x96 的图像),要通过这种全联通…
图像质量评估函数的分类曾是一个比较有争议的话题,在2l世纪以前曾经有过 比较多的讨论.但是随着研究的深入和技术的广泛应用,研究人员对于图像质量 评估函数的分类有了统一的认识,即从实际应用中参考信息供给的角度,将图像质量 评估函数分为以下三种方式: ·全信息评估(full reference) ·盲信息评估(no reference) · 部分信息评估(reduced reference) 其中全信息评估是指参考图像完全清楚时候,即参考目标信息完全清楚的情况 下,对被测图像进行评估方式:盲信息评估…
课程地址 第1章 CS231n课程介绍 ---1.1 计算机视觉概述 这门课的主要内容是计算机视觉.它是一门需要涉及很多其他科目知识的学科. 视觉数据占据了互联网的绝大多数,但是它们很难利用. ---1.2 计算机视觉历史背景 为了获得一副3D图像,我们需要经历原始图像(端点,曲线,边缘)->2.5维草图(场景的不连续性)->3D图像几个过程. 70年代:每个对象由简单的几何图单位组成 80年代:如何识别由简单物体构成的视觉空间 如果目标识别太难了,应该先进行图像分割. 可以使用图片中的特征来…
Facebook 人工智能研究院(FAIR)首席科学家 Devi Parikh 是 2017 年 IJCAI 计算机和思想奖获得者(IJCAI 两个最重要的奖项之一,被誉为国际人工智能领域的「菲尔兹奖」),并位列福布斯 2017 年「20 位引领 AI 研究的女性」榜单.她主要从事计算机视觉和模式识别研究,具体研究领域包括计算机视觉.语言与视觉.通识推理.人工智能.人机合作.语境推理以及模式识别. 2008 年到现在,Devi Parikh 先后在计算机视觉三大顶级会议(ICCV.CVPR.EC…
lavaan简明教程 [中文翻译版] 译者注:此文档原作者为比利时Ghent大学的Yves Rosseel博士,lavaan亦为其开发,完全开源.免费.我在学习的时候顺手翻译了一下,向Yves的开源精神致敬.此翻译因偷懒部分删减,但也有增加,有错误请留言 「转载请注明出处」 目录 lavaan简明教程 [中文翻译版] 目录 摘要 在开始之前 安装lavaan包 模型语法 例1:验证性因子分析(CFA) 例2:结构方程(SEM) 更多关于语法的内容 6.1 固定参数 6.2 初值 6.3 参数标签…
写在前面的乱七八糟的前言:当当当,现在是早上9:06,emmm是我是我还是我,(*╹▽╹*)今天讲讲BT这个磨人的小妖精,为什么说磨人呢,因为用的好就不磨人了啊~咳咳就跟我女盆友一样┓( ´∀` )┏.秉承万物皆对象,对象有空间的原则,BT框架提供了很多模块化的东西,写了一堆的CSS,如果要搭建一个个性化又复杂的网站,我劝你从良,少年~那怎么搞?不学吗,辣是不可能滴这么好用的框架,不学太可惜了,一个小小建议,先学怎么应用,再学怎么使用,哦吼?应用和使用不是一回事吗?少年你又水我!no no no…
前言 在HTML布局中有很多的选择,同一种表现方式可以使用不同的方法来实现.下面来对四种最常见的布局方式进行阐述和解释,它们分别是Float,Table,Grid和Flex Float 第一位出场的就是最年老的Float,"老骥伏枥,志在千里".作为最早出现的定位方式,为元素赋予了"浮动显示"的技能,从此,元素可以不跟着文档的方向随波逐流,而可以拥有自己的"浮动方向",可以说是CSS里面最常出现的熟人了. float不仅仅出现在网页上,事实上它借…
转载链接:移动端开发中,关于适配问题的一点总结(一) 视口 布局视口layout viewport 视觉视口visual viewport 理想视口 缩放 一个重大区别 最小缩放 和最大缩放 分辨率 物理分辨率dpi 设备像素比 dpr dipsdevice-independent pixels 例子 meta视口 完美的meta 视口 视口 <meta name="viewport" content="width=device-width"/> 我们一…
最早的SLAM雏形是在军事(核潜艇的海底定位)上的应用,主要传感器是军用雷达.SLAM技术发展到如今已经几十年,目前以激光雷达作为主传感器的SLAM技术比较稳定.可靠,仍然是主流的技术方案.但随着最近几年计算机视觉技术的快速发展,SLAM技术越来越多的应用于家用机器人.无人机.AR设备,基于视觉的Visual SLAM(简称VSLAM)逐渐开始崭露头角.今天就来帮大家普及下VSLAM的技术框架.   VSLAM技术架构 VSLAM的技术框架主要包括传感器数据预处理.前端.后端.回环检测.建图.…
本文译自 Nick Waggoner 的 "Understand what’s possible with the Windows UI Animation Engine",已获原作者授权进行翻译.更多有关 Windows UI.UWP 开发的文章,欢迎访问我的博客源站:http://validvoid.net/ 2015 年 11 月,视觉层 (Visual Layer)作为 Windows.UI.Composition 命名空间中的一系列新 API 被引入.这些新 API 标志着开…
理解javafx 架构 ● 场景图(Scene Graph) ● JavaFX功能的公开API(Java Public APIs for JavaFX Features) ● 图形系统(Graphics System) ● Glass窗体工具包(Glass Windowing Toolkit) ● 多媒体和图像(Media and Images) ● Web组件(Web Component) ● CSS ● UI控件(UI Controls) ● 布局(Layout) ● 2-D和3-D转换(2…