第二讲_图像数据处理Image Data Processing

  • 深度模型出现后被弱化,但是思想的影子在深度模型中可以看到的

图片存储原理

  • RGB颜色空间:三通道(b,g,r),加法混色
  • CMY(K):减法混色,用到印刷中;四个通道(c,m,y,k)
  • HSI/HSV颜色空间:基于人类视觉;
  • CIE-XYZ颜色空间:国际照明协会,人类视觉系统-视锥细胞:主要有短,中,长波段
  • CIE-Lab对色空间
  • 单通道灰度图:Gray=R0.3+G0.59+B*0.11,转换公式灰度化

空域分析和变换

  • 滤波和卷积
  • 领域参数选择,模板参数设计
  • 边界补充方式:补零;边界复制(replication),镜像(reflection),块复制(wraparound)
  • 平滑均值滤波/卷积
  • 平滑中值滤波/卷积:有效出去椒盐噪声
  • 平滑高斯滤波/卷积:离中心越近,权重越大
  • sigma越小,越集中中心区域
    -深度模型改进时进行2D->1D降计算
  • 梯度Prewitt滤波/卷积
  • 梯度Sobel滤波/卷积
  • 梯度Laplacian滤波/卷积
  • 其中领域大小为超参数,需要实验确定
  • 锐化,LOG
  • canny边缘检测算子实现
  • canny算子

    Canny边缘检测算法:
    step1:用高斯滤波器平滑图象;
    step2:用一阶偏导的有限差分来计算梯度的幅值和方向;
    step3:对梯度幅值进行非极大值抑制;
    step4:用双阈值算法检测和连接边缘。

频域分析及变换

傅里叶变换

  • 滤波-除去特定频率和加速计算-时域卷积变为频域相乘
  • 应用信号分解
  • 离中心点越远,频率越高,越亮幅度越大
  • 相位即梯度的方向,不同的相位方向表示不同的边缘轮廓
  • 空域卷积=频域相乘

    高斯金字塔

  • 高斯卷积+降采样
  • 高斯金字塔的必要性,直接降采样损失信息
  • 尺度空间:不同尺度适合不同尺寸的物体,合适的尺度永远未知。

拉普拉斯字塔Laplacian

  • 保留高频信息,用于图像恢复
  • 左边Gaussian Pyramid由上向下;中间Laplacian Pyramid由下到上;右边图像是图像恢复

模板匹配

  • 相似度量

第二讲_图像数据处理Image Data Processing的更多相关文章

  1. 第九讲_图像生成 Image Captioning

    第九讲_图像生成 Image Captioning 生成式对抗网络 Generative Adversarial network 学习数据分布:概率密度函数估计+数据样本生成 生成式模型是共生关系,判 ...

  2. 第八讲_图像问答Image Question Answering

    第八讲_图像问答Image Question Answering 课程结构 图像问答的描述 具备一系列AI能力:细分识别,物体检测,动作识别,常识推理,知识库推理..... 先要根据问题,判断什么任务 ...

  3. 『cs231n』作业3问题4选讲_图像梯度应用强化

    [注],本节(上节也是)的model是一个已经训练完成的CNN分类网络. 随机数图片向前传播后对目标类优化,反向优化图片本体 def create_class_visualization(target ...

  4. C语言_第二讲_规范以及常用数据类型

    一丶编码规范基本数据类型 编码规范 任何程序员,都应该有良好的的编码习惯,便于以后的代码可读性和维护 常见了编码规范有 匈牙利命名法 驼峰式大小写 匈牙利命名法: 是电脑程序设计中的一种变量命名规则, ...

  5. 大数据技术原理与应用:【第二讲】大数据处理架构Hadoop

    2.1 Hadoop概论 创始人:Doug Cutting 1.简介: 开源免费; 操作简单,极大降低使用的复杂性; Hadoop是Java开发的; 在Hadoop上开发应用支持多种编程语言.不限于J ...

  6. SQL Server Reporting Services 自定义数据处理扩展DPE(Data Processing Extension)

    最近在做SSRS项目时,遇到这么一个情形:该项目有多个数据库,每个数据库都在不同的服务器,但每个数据库所拥有的数据库对象(table/view/SPs/functions)都是一模一样的,后来结合网络 ...

  7. SQL Server Reporting Service(SSRS) 第五篇 自定义数据处理扩展DPE(Data Processing Extension)

    最近在做SSRS项目时,遇到这么一个情形:该项目有多个数据库,每个数据库都在不同的服务器,但每个数据库所拥有的数据库对象(table/view/SPs/functions)都是一模一样的,后来结合网络 ...

  8. TensorFlow学习笔记(五)图像数据处理

    目录: 一.TFRecord输入数据格式 1.1 TFrecord格式介绍 1.2 TFRecord样例程序 二.图像数据处理 2.1TensorFlow图像处理函数 2.2图像预处理完整样例 三.多 ...

  9. [翻译]MapReduce: Simplified Data Processing on Large Clusters

    MapReduce: Simplified Data Processing on Large Clusters MapReduce:面向大型集群的简化数据处理 摘要 MapReduce既是一种编程模型 ...

随机推荐

  1. 记服务器 httpd 服务无法启动

    httpd 服务无法重启 ,网上查到的资料都是端口号冲突 ,记录一下自己的解决办法 !!! 首先查看 服务状态 :  service status httpd / systemctl status h ...

  2. The Fourth Day

    迭代器 迭代器:迭代的工具 .什么是迭代:指的是一个重复的过程,每次重复称为一次迭代,并且每次重复的结果是下一次重复的初始值 例: while True: print('====>'') l=[ ...

  3. 五分钟入门 Dingo API

    基于 https://laravel-china.org/doc... 文档更简洁的描述Dingo,直戳重点,注重实践 Django-Book 概述 Dingo API帮助您轻松快速地构建自己的API ...

  4. windows终端输入pip install requests报错:Fatal error in launcher

    emm今天群友发了个图,说他的pip报错,是这个问题 emmm这个问题我也不太懂,后来让他pip install requests这样操作,, 还是不管用,我寻思这个错咋回事,让他用  python  ...

  5. python--BOM和DOM

    一. 介绍 什么是BOM和DOM? 简要答案:BOM是浏览器对象模型,用来获取或设置浏览器的属性.行为,例如:新建窗口.获取屏幕分辨率.浏览器版本号等. DOM是文档对象模型,用来获取或设置文档中标签 ...

  6. 安装tesserocr的步骤和报错RuntimeError: Failed to init API, possibly an invalid tessdata path解决办法

    1,首先下载合适的tesseract-ocr的版本 2,然后安装到这一步注意要勾选这一项来安装OCR识别支持的语言包,这样OCR就可以识别多国语言,然后就可以一直点击下一步完成安装. 3,安装tess ...

  7. python 学习总结5

    字符串类型及操作 一.字符串类型的表示 (1)字符串:由0个或多个字符组成的有序字符序列  例如:“请输入带有符号的温度值” 或者‘c’都是字符串 (2)字符串是字符的有序序列,可以对其中的字符进行索 ...

  8. Cypress EZ-USB FX3 DMA模式下的串口通讯

    由于公司设备升级后出了问题,需要对USB驱动进行修改,原本使用的是寄存器模式进行UART传输,但是由于FX3寄存器模式会出现长时间延时等待的问题,不得不对其传输模式进行修改.虽然赛普拉斯的EZ-USB ...

  9. UnicodeDecodeError: 'gbk' codec can't decode byte 0xae in position 167: illegal multibyte sequence

    UnicodeDecodeError: 'gbk' codec can't decode byte 0xae in position 167: illegal multibyte sequence文件 ...

  10. 在oracle中怎么通过字段名查询其所在的表

    ora = //连接描述符名:ora (description = //描述 (address = //网络地址之一 (protocol = tcp) //网络协议(tcp表示TCP/IP协议) (h ...