https://github.com/aleju/imgaug

介绍一下官方demo中用到的几个变换,工程README.md已经给出了API简介,个人觉得不好理解,特此单独记录一下:

  1. import numpy as np
  2. import imgaug as ia
  3. import imgaug.augmenters as iaa
  4.  
  5. # random example images
  6. images = np.random.randint(0, 255, (16, 128, 128, 3), dtype=np.uint8)
  7.  
  8. # Sometimes(0.5, ...) applies the given augmenter in 50% of all cases,
  9. # e.g. Sometimes(0.5, GaussianBlur(0.3)) would blur roughly every second image.
  10. sometimes = lambda aug: iaa.Sometimes(0.5, aug)
  11.  
  12. # Define our sequence of augmentation steps that will be applied to every image
  13. # All augmenters with per_channel=0.5 will sample one value _per image_
  14. # in 50% of all cases. In all other cases they will sample new values
  15. # _per channel_.
  16. seq = iaa.Sequential(
  17. [
  18. # apply the following augmenters to most images
  19. iaa.Fliplr(0.5), # horizontally flip 50% of all images
  20. iaa.Flipud(0.2), # vertically flip 20% of all images
  21. # crop images by -5% to 10% of their height/width
  22. sometimes(iaa.CropAndPad(
  23. percent=(-0.05, 0.1),
  24. pad_mode=ia.ALL,
  25. pad_cval=(0, 255)
  26. )),
  27. sometimes(iaa.Affine(
  28. scale={"x": (0.8, 1.2), "y": (0.8, 1.2)}, # scale images to 80-120% of their size, individually per axis
  29. translate_percent={"x": (-0.2, 0.2), "y": (-0.2, 0.2)}, # translate by -20 to +20 percent (per axis)
  30. rotate=(-45, 45), # rotate by -45 to +45 degrees
  31. shear=(-16, 16), # shear by -16 to +16 degrees
  32. order=[0, 1], # use nearest neighbour or bilinear interpolation (fast)
  33. cval=(0, 255), # if mode is constant, use a cval between 0 and 255
  34. mode=ia.ALL # use any of scikit-image's warping modes (see 2nd image from the top for examples)
  35. )),
  36. # execute 0 to 5 of the following (less important) augmenters per image
  37. # don't execute all of them, as that would often be way too strong
  38. iaa.SomeOf((0, 5),
  39. [
  40. sometimes(iaa.Superpixels(p_replace=(0, 1.0), n_segments=(20, 200))), # convert images into their superpixel representation
  41. iaa.OneOf([
  42. iaa.GaussianBlur((0, 3.0)), # blur images with a sigma between 0 and 3.0
  43. iaa.AverageBlur(k=(2, 7)), # blur image using local means with kernel sizes between 2 and 7
  44. iaa.MedianBlur(k=(3, 11)), # blur image using local medians with kernel sizes between 2 and 7
  45. ]),
  46. iaa.Sharpen(alpha=(0, 1.0), lightness=(0.75, 1.5)), # sharpen images
  47. iaa.Emboss(alpha=(0, 1.0), strength=(0, 2.0)), # emboss images
  48. # search either for all edges or for directed edges,
  49. # blend the result with the original image using a blobby mask
  50. iaa.SimplexNoiseAlpha(iaa.OneOf([
  51. iaa.EdgeDetect(alpha=(0.5, 1.0)),
  52. iaa.DirectedEdgeDetect(alpha=(0.5, 1.0), direction=(0.0, 1.0)),
  53. ])),
  54. iaa.AdditiveGaussianNoise(loc=0, scale=(0.0, 0.05*255), per_channel=0.5), # add gaussian noise to images
  55. iaa.OneOf([
  56. iaa.Dropout((0.01, 0.1), per_channel=0.5), # randomly remove up to 10% of the pixels
  57. iaa.CoarseDropout((0.03, 0.15), size_percent=(0.02, 0.05), per_channel=0.2),
  58. ]),
  59. iaa.Invert(0.05, per_channel=True), # invert color channels
  60. iaa.Add((-10, 10), per_channel=0.5), # change brightness of images (by -10 to 10 of original value)
  61. iaa.AddToHueAndSaturation((-20, 20)), # change hue and saturation
  62. # either change the brightness of the whole image (sometimes
  63. # per channel) or change the brightness of subareas
  64. iaa.OneOf([
  65. iaa.Multiply((0.5, 1.5), per_channel=0.5),
  66. iaa.FrequencyNoiseAlpha(
  67. exponent=(-4, 0),
  68. first=iaa.Multiply((0.5, 1.5), per_channel=True),
  69. second=iaa.ContrastNormalization((0.5, 2.0))
  70. )
  71. ]),
  72. iaa.ContrastNormalization((0.5, 2.0), per_channel=0.5), # improve or worsen the contrast
  73. iaa.Grayscale(alpha=(0.0, 1.0)),
  74. sometimes(iaa.ElasticTransformation(alpha=(0.5, 3.5), sigma=0.25)), # move pixels locally around (with random strengths)
  75. sometimes(iaa.PiecewiseAffine(scale=(0.01, 0.05))), # sometimes move parts of the image around
  76. sometimes(iaa.PerspectiveTransform(scale=(0.01, 0.1)))
  77. ],
  78. random_order=True
  79. )
  80. ],
  81. random_order=True
  82. )
  83.  
  84. images_aug = seq.augment_images(images)

Superpixels:生成随机数量的超像素区域,对原图进行替换,直观效果是原图部分区域变得模糊

各种blur:模糊,对应几种滤波操作

sharp:字面意思,锐化

emboss:压印浮凸字体(或图案); 凹凸印

EdgeDetect:边缘检测

DirectedEdgeDetect:边缘检测,只检测某些方向的,直观来看和上面的比检测出来的数目会少很多

DropOut:随机丢弃像素

CoarseDropout:随机丢弃某位置某通道像素

Invert:有一定几率将batch中的图片像素取反(或者特定通道取反)

Add:像素值成比例增加/减小(特指亮度)

AddToHueAndSaturation:增加色相、饱和度

Multiply:每个像素随机乘一个数(各不相图),造成局部变亮、局部变暗

ContrastNormalization:调整对比度,0.5表示和128的差值部分会处以2降低对比度

FrequencyNoiseAlpha:参数需要两个增强函数,本函数会混合两个增强函数增强后的结果

Grayscale:灰度图和原图的混合(1意味着全灰度)

『计算机视觉』imgaug图像增强库中部分API简介的更多相关文章

  1. 『计算机视觉』Mask-RCNN_训练网络其三:训练Model

    Github地址:Mask_RCNN 『计算机视觉』Mask-RCNN_论文学习 『计算机视觉』Mask-RCNN_项目文档翻译 『计算机视觉』Mask-RCNN_推断网络其一:总览 『计算机视觉』M ...

  2. 『计算机视觉』Mask-RCNN_从服装关键点检测看KeyPoints分支

    下图Github地址:Mask_RCNN       Mask_RCNN_KeyPoints『计算机视觉』Mask-RCNN_论文学习『计算机视觉』Mask-RCNN_项目文档翻译『计算机视觉』Mas ...

  3. 『计算机视觉』Mask-RCNN_训练网络其二:train网络结构&损失函数

    Github地址:Mask_RCNN 『计算机视觉』Mask-RCNN_论文学习 『计算机视觉』Mask-RCNN_项目文档翻译 『计算机视觉』Mask-RCNN_推断网络其一:总览 『计算机视觉』M ...

  4. 『计算机视觉』Mask-RCNN_训练网络其一:数据集与Dataset类

    Github地址:Mask_RCNN 『计算机视觉』Mask-RCNN_论文学习 『计算机视觉』Mask-RCNN_项目文档翻译 『计算机视觉』Mask-RCNN_推断网络其一:总览 『计算机视觉』M ...

  5. 『计算机视觉』Mask-RCNN_锚框生成

    Github地址:Mask_RCNN 『计算机视觉』Mask-RCNN_论文学习 『计算机视觉』Mask-RCNN_项目文档翻译 『计算机视觉』Mask-RCNN_推断网络其一:总览 『计算机视觉』M ...

  6. 『计算机视觉』Mask-RCNN_推断网络终篇:使用detect方法进行推断

    一.detect和build 前面多节中我们花了大量笔墨介绍build方法的inference分支,这节我们看看它是如何被调用的. 在dimo.ipynb中,涉及model的操作我们简单进行一下汇总, ...

  7. 『计算机视觉』Mask-RCNN_推断网络其六:Mask生成

    一.Mask生成概览 上一节的末尾,我们已经获取了待检测图片的分类回归信息,我们将回归信息(即待检测目标的边框信息)单独提取出来,结合金字塔特征mrcnn_feature_maps,进行Mask生成工 ...

  8. 『计算机视觉』Mask-RCNN_推断网络其四:FPN和ROIAlign的耦合

    一.模块概述 上节的最后,我们进行了如下操作获取了有限的proposal, # [IMAGES_PER_GPU, num_rois, (y1, x1, y2, x2)] # IMAGES_PER_GP ...

  9. 『计算机视觉』Mask-RCNN_推断网络其三:RPN锚框处理和Proposal生成

    一.RPN锚框信息生成 上文的最后,我们生成了用于计算锚框信息的特征(源代码在inference模式中不进行锚框生成,而是外部生成好feed进网络,training模式下在向前传播时直接生成锚框,不过 ...

随机推荐

  1. This server is in the failed servers list: localhost/127.0.0.1:16000 启动hbase api调用错误

    api 调用发现错误 Mon Nov 18 23:04:31 CST 2019, RpcRetryingCaller{globalStartTime=1574089469858, pause=100, ...

  2. 史上最全的CSP-J/S 第一轮知识点

    CSP-J/S 第一轮知识点选讲 \(NOIP\)(全国青少年信息学奥林匹克竞赛)于2019年取消.取而代之的是由\(CCF\)推出的非专业级软件能力认证,也就是现在的\(CSP-J/S\).作为一名 ...

  3. Oracle工具PLSQL

    2018版的PLSQL美化工具在Tools中的PL/SQL Beautifier中 如下:

  4. 树莓派跑yolo

    https://blog.csdn.net/u011304078/article/details/85772764 https://blog.csdn.net/weixin_41665225/arti ...

  5. A1083 List Grades (25 分)

    Given a list of N student records with name, ID and grade. You are supposed to sort the records with ...

  6. Linux性能优化实战学习笔记:第五讲

    一.什么是CPU的使用率 1.你最常用什么指标来描述系统的CPU性能? 我想你的答案,可能不是平均负载,也不是CPU上下文切换,而是另一个更直观的指标CPU使用率 CPU使用率到底是怎么算出来的吗? ...

  7. Linux性能优化实战学习笔记:第五十八讲

    一.上节回顾 专栏更新至今,咱们专栏最后一部分——综合案例模块也要告一段落了.很高兴看到你没有掉队,仍然在积极学习思考.实践操作,并热情地分享你在实际环境中,遇到过的各种性能问题的分析思路以及优化方法 ...

  8. [LeetCode] 248. Strobogrammatic Number III 对称数之三

    A strobogrammatic number is a number that looks the same when rotated 180 degrees (looked at upside ...

  9. 第09组 Beta冲刺(4/5)

    队名:观光队 链接 组长博客 作业博客 组员实践情况 王耀鑫 过去两天完成了哪些任务 文字/口头描述 学习 展示GitHub当日代码/文档签入记录 无 接下来的计划 完成短租车,页面美化 还剩下哪些任 ...

  10. Qt 绘制图表 - Qt Charts版

    一.前言 自从 Qt 发布以来,给广大跨平台界面研发人员带来了无数的福利.但是Qt自己却一直没有提供自带的图表库,这就使得 QWT.QCustomPlot 等第三方图表库有了巨大的生存空间,为了降低开 ...