python小项目（python实现鉴黄）源码

 import sys

 import os

 import _io

 from collections import namedtuple

 from PIL import Image

 class Nude(object):

     Skin = namedtuple("Skin", "id skin region x y")

     def __init__(self, path_or_image):

         # 若 path_or_image 为 Image.Image 类型的实例，直接赋值

         if isinstance(path_or_image, Image.Image):

             self.image = path_or_image

         # 若 path_or_image 为 str 类型的实例，打开图片

         elif isinstance(path_or_image, str):

             self.image = Image.open(path_or_image)

         # 获得图片所有颜色通道

         bands = self.image.getbands()

         # 判断是否为单通道图片（也即灰度图），是则将灰度图转换为 RGB 图

         if len(bands) == 1:

             # 新建相同大小的 RGB 图像

             new_img = Image.new("RGB", self.image.size)

             # 拷贝灰度图 self.image 到 RGB图 new_img.paste （PIL 自动进行颜色通道转换）

             new_img.paste(self.image)

             f = self.image.filename

             # 替换 self.image

             self.image = new_img

             self.image.filename = f

         # 存储对应图像所有像素的全部 Skin 对象

         self.skin_map = []

         # 检测到的皮肤区域，元素的索引即为皮肤区域号，元素都是包含一些 Skin 对象的列表

         self.detected_regions = []

         # 元素都是包含一些 int 对象（区域号）的列表

         # 这些元素中的区域号代表的区域都是待合并的区域

         self.merge_regions = []

         # 整合后的皮肤区域，元素的索引即为皮肤区域号，元素都是包含一些 Skin 对象的列表

         self.skin_regions = []

         # 最近合并的两个皮肤区域的区域号，初始化为 -1

         self.last_from, self.last_to = -1, -1

         # 色情图像判断结果

         self.result = None

         # 处理得到的信息

         self.message = None

         # 图像宽高

         self.width, self.height = self.image.size

         # 图像总像素

         self.total_pixels = self.width * self.height

     def resize(self, maxwidth=1000, maxheight=1000):

         """

         基于最大宽高按比例重设图片大小，

         注意：这可能影响检测算法的结果

         如果没有变化返回 0

         原宽度大于 maxwidth 返回 1

         原高度大于 maxheight 返回 2

         原宽高大于 maxwidth, maxheight 返回 3

         maxwidth - 图片最大宽度

         maxheight - 图片最大高度

         传递参数时都可以设置为 False 来忽略

         """

         # 存储返回值

         ret = 0

         if maxwidth:

             if self.width > maxwidth:

                 wpercent = (maxwidth / self.width)

                 hsize = int((self.height * wpercent))

                 fname = self.image.filename

                 # Image.LANCZOS 是重采样滤波器，用于抗锯齿

                 self.image = self.image.resize((maxwidth, hsize), Image.LANCZOS)

                 self.image.filename = fname

                 self.width, self.height = self.image.size

                 self.total_pixels = self.width * self.height

                 ret += 1

         if maxheight:

             if self.height > maxheight:

                 hpercent = (maxheight / float(self.height))

                 wsize = int((float(self.width) * float(hpercent)))

                 fname = self.image.filename

                 self.image = self.image.resize((wsize, maxheight), Image.LANCZOS)

                 self.image.filename = fname

                 self.width, self.height = self.image.size

                 self.total_pixels = self.width * self.height

                 ret += 2

         return ret

     # 分析函数

     def parse(self):

         # 如果已有结果，返回本对象

         if self.result is not None:

             return self

         # 获得图片所有像素数据

         pixels = self.image.load()

         # 遍历每个像素

         for y in range(self.height):

             for x in range(self.width):

                 # 得到像素的 RGB 三个通道的值

                 # [x, y] 是 [(x,y)] 的简便写法

                 r = pixels[x, y][0]   # red

                 g = pixels[x, y][1]   # green

                 b = pixels[x, y][2]   # blue

                 # 判断当前像素是否为肤色像素

                 isSkin = True if self._classify_skin(r, g, b) else False

                 # 给每个像素分配唯一 id 值（1, 2, 3...height*width）

                 # 注意 x, y 的值从零开始

                 _id = x + y * self.width + 1

                 # 为每个像素创建一个对应的 Skin 对象，并添加到 self.skin_map 中

                 self.skin_map.append(self.Skin(_id, isSkin, None, x, y))

                 # 若当前像素不为肤色像素，跳过此次循环

                 if not isSkin:

                     continue

                 # 设左上角为原点，相邻像素为符号 *，当前像素为符号 ^，那么相互位置关系通常如下图

                 # ***

                 # *^

                 # 存有相邻像素索引的列表，存放顺序为由大到小，顺序改变有影响

                 # 注意 _id 是从 1 开始的，对应的索引则是 _id-1

                 check_indexes = [_id - 2, # 当前像素左方的像素

                                  _id - self.width - 2,  # 当前像素左上方的像素

                                  _id - self.width - 1,  # 当前像素的上方的像素

                                  _id - self.width]  # 当前像素右上方的像素

                 # 用来记录相邻像素中肤色像素所在的区域号，初始化为 -1

                 region = -1

                 # 遍历每一个相邻像素的索引

                 for index in check_indexes:

                     # 尝试索引相邻像素的 Skin 对象，没有则跳出循环

                     try:

                         self.skin_map[index]

                     except IndexError:

                         break

                     # 相邻像素若为肤色像素：

                     if self.skin_map[index].skin:

                         # 若相邻像素与当前像素的 region 均为有效值，且二者不同，且尚未添加相同的合并任务

                         if (self.skin_map[index].region != None and

                                 region != None and region != -1 and

                                 self.skin_map[index].region != region and

                                 self.last_from != region and

                                 self.last_to != self.skin_map[index].region) :

                             # 那么这添加这两个区域的合并任务

                             self._add_merge(region, self.skin_map[index].region)

                         # 记录此相邻像素所在的区域号

                         region = self.skin_map[index].region

                 # 遍历完所有相邻像素后，若 region 仍等于 -1，说明所有相邻像素都不是肤色像素

                 if region == -1:

                     # 更改属性为新的区域号，注意元祖是不可变类型，不能直接更改属性

                     _skin = self.skin_map[_id - 1]._replace(region=len(self.detected_regions))

                     self.skin_map[_id - 1] = _skin

                     # 将此肤色像素所在区域创建为新区域

                     self.detected_regions.append([self.skin_map[_id - 1]])

                 # region 不等于 -1 的同时不等于 None，说明有区域号为有效值的相邻肤色像素

                 elif region != None:

                     # 将此像素的区域号更改为与相邻像素相同

                     _skin = self.skin_map[_id - 1]._replace(region=region)

                     self.skin_map[_id - 1] = _skin

                     # 向这个区域的像素列表中添加此像素

                     self.detected_regions[region].append(self.skin_map[_id - 1])

         # 完成所有区域合并任务，合并整理后的区域存储到 self.skin_regions

         self._merge(self.detected_regions, self.merge_regions)

         # 分析皮肤区域，得到判定结果

         self._analyse_regions()

         return self

     # self.merge_regions 的元素都是包含一些 int 对象（区域号）的列表

     # self.merge_regions 的元素中的区域号代表的区域都是待合并的区域

     # 这个方法便是将两个待合并的区域号添加到 self.merge_regions 中

     def _add_merge(self, _from, _to):

         # 两个区域号赋值给类属性

         self.last_from = _from

         self.last_to = _to

         # 记录 self.merge_regions 的某个索引值，初始化为 -1

         from_index = -1

         # 记录 self.merge_regions 的某个索引值，初始化为 -1

         to_index = -1

         # 遍历每个 self.merge_regions 的元素

         for index, region in enumerate(self.merge_regions):

             # 遍历元素中的每个区域号

             for r_index in region:

                 if r_index == _from:

                     from_index = index

                 if r_index == _to:

                     to_index = index

         # 若两个区域号都存在于 self.merge_regions 中

         if from_index != -1 and to_index != -1:

             # 如果这两个区域号分别存在于两个列表中

             # 那么合并这两个列表

             if from_index != to_index:

                 self.merge_regions[from_index].extend(self.merge_regions[to_index])

                 del(self.merge_regions[to_index])

             return

         # 若两个区域号都不存在于 self.merge_regions 中

         if from_index == -1 and to_index == -1:

             # 创建新的区域号列表

             self.merge_regions.append([_from, _to])

             return

         # 若两个区域号中有一个存在于 self.merge_regions 中

         if from_index != -1 and to_index == -1:

             # 将不存在于 self.merge_regions 中的那个区域号

             # 添加到另一个区域号所在的列表

             self.merge_regions[from_index].append(_to)

             return

         # 若两个待合并的区域号中有一个存在于 self.merge_regions 中

         if from_index == -1 and to_index != -1:

             # 将不存在于 self.merge_regions 中的那个区域号

             # 添加到另一个区域号所在的列表

             self.merge_regions[to_index].append(_from)

             return

     # 合并该合并的皮肤区域

     def _merge(self, detected_regions, merge_regions):

         # 新建列表 new_detected_regions

         # 其元素将是包含一些代表像素的 Skin 对象的列表

         # new_detected_regions 的元素即代表皮肤区域，元素索引为区域号

         new_detected_regions = []

         # 将 merge_regions 中的元素中的区域号代表的所有区域合并

         for index, region in enumerate(merge_regions):

             try:

                 new_detected_regions[index]

             except IndexError:

                 new_detected_regions.append([])

             for r_index in region:

                 new_detected_regions[index].extend(detected_regions[r_index])

                 detected_regions[r_index] = []

         # 添加剩下的其余皮肤区域到 new_detected_regions

         for region in detected_regions:

             if len(region) > 0:

                 new_detected_regions.append(region)

         # 清理 new_detected_regions

         self._clear_regions(new_detected_regions)

     # 皮肤区域清理函数

     # 只保存像素数大于指定数量的皮肤区域

     def _clear_regions(self, detected_regions):

         for region in detected_regions:

             if len(region) > 30:

                 self.skin_regions.append(region)

     # 分析区域

     def _analyse_regions(self):

         # 如果皮肤区域小于 3 个，不是色情

         if len(self.skin_regions) < 3:

             self.message = "Less than 3 skin regions ({_skin_regions_size})".format(

                 _skin_regions_size=len(self.skin_regions))

             self.result = False

             return self.result

         # 为皮肤区域排序

         self.skin_regions = sorted(self.skin_regions, key=lambda s: len(s),

                                    reverse=True)

         # 计算皮肤总像素数

         total_skin = float(sum([len(skin_region) for skin_region in self.skin_regions]))

         # 如果皮肤区域与整个图像的比值小于 15%，那么不是色情图片

         if total_skin / self.total_pixels * 100 < 15:

             self.message = "Total skin percentage lower than 15 ({:.2f})".format(total_skin / self.total_pixels * 100)

             self.result = False

             return self.result

         # 如果最大皮肤区域小于总皮肤面积的 45%，不是色情图片

         if len(self.skin_regions[0]) / total_skin * 100 < 45:

             self.message = "The biggest region contains less than 45 ({:.2f})".format(len(self.skin_regions[0]) / total_skin * 100)

             self.result = False

             return self.result

         # 皮肤区域数量超过 60个，不是色情图片

         if len(self.skin_regions) > 60:

             self.message = "More than 60 skin regions ({})".format(len(self.skin_regions))

             self.result = False

             return self.result

         # 其它情况为色情图片

         self.message = "Nude!!"

         self.result = True

         return self.result

     # 基于像素的肤色检测技术

     def _classify_skin(self, r, g, b):

         # 根据RGB值判定

         rgb_classifier = r > 95 and \

             g > 40 and g < 100 and \

             b > 20 and \

             max([r, g, b]) - min([r, g, b]) > 15 and \

             abs(r - g) > 15 and \

             r > g and \

             r > b

         # 根据处理后的 RGB 值判定

         nr, ng, nb = self._to_normalized(r, g, b)

         norm_rgb_classifier = nr / ng > 1.185 and \

             float(r * b) / ((r + g + b) ** 2) > 0.107 and \

             float(r * g) / ((r + g + b) ** 2) > 0.112

         # HSV 颜色模式下的判定

         h, s, v = self._to_hsv(r, g, b)

         hsv_classifier = h > 0 and \

             h < 35 and \

             s > 0.23 and \

             s < 0.68

         # YCbCr 颜色模式下的判定

         y, cb, cr = self._to_ycbcr(r, g,  b)

         ycbcr_classifier = 97.5 <= cb <= 142.5 and 134 <= cr <= 176

         # 效果不是很好，还需改公式

         # return rgb_classifier or norm_rgb_classifier or hsv_classifier or ycbcr_classifier

         return ycbcr_classifier

     def _to_normalized(self, r, g, b):

         if r == 0:

             r = 0.0001

         if g == 0:

             g = 0.0001

         if b == 0:

             b = 0.0001

         _sum = float(r + g + b)

         return [r / _sum, g / _sum, b / _sum]

     def _to_ycbcr(self, r, g, b):

         # 公式来源：

         # http://stackoverflow.com/questions/19459831/rgb-to-ycbcr-conversion-problems

         y = .299*r + .587*g + .114*b

         cb = 128 - 0.168736*r - 0.331364*g + 0.5*b

         cr = 128 + 0.5*r - 0.418688*g - 0.081312*b

         return y, cb, cr

     def _to_hsv(self, r, g, b):

         h = 0

         _sum = float(r + g + b)

         _max = float(max([r, g, b]))

         _min = float(min([r, g, b]))

         diff = float(_max - _min)

         if _sum == 0:

             _sum = 0.0001

         if _max == r:

             if diff == 0:

                 h = sys.maxsize

             else:

                 h = (g - b) / diff

         elif _max == g:

             h = 2 + ((g - r) / diff)

         else:

             h = 4 + ((r - g) / diff)

         h *= 60

         if h < 0:

             h += 360

         return [h, 1.0 - (3.0 * (_min / _sum)), (1.0 / 3.0) * _max]

     def inspect(self):

         _image = '{} {} {}×{}'.format(self.image.filename, self.image.format, self.width, self.height)

         return "{_image}: result={_result} message='{_message}'".format(_image=_image, _result=self.result, _message=self.message)

     # 将在源文件目录生成图片文件，将皮肤区域可视化

     def showSkinRegions(self):

         # 未得出结果时方法返回

         if self.result is None:

             return

         # 皮肤像素的 ID 的集合

         skinIdSet = set()

         # 将原图做一份拷贝

         simage = self.image

         # 加载数据

         simageData = simage.load()

         # 将皮肤像素的 id 存入 skinIdSet

         for sr in self.skin_regions:

             for pixel in sr:

                 skinIdSet.add(pixel.id)

         # 将图像中的皮肤像素设为白色，其余设为黑色

         for pixel in self.skin_map:

             if pixel.id not in skinIdSet:

                 simageData[pixel.x, pixel.y] = 0, 0, 0

             else:

                 simageData[pixel.x, pixel.y] = 255, 255, 255

         # 源文件绝对路径

         filePath = os.path.abspath(self.image.filename)

         # 源文件所在目录

         fileDirectory = os.path.dirname(filePath) + '/'

         # 源文件的完整文件名

         fileFullName = os.path.basename(filePath)

         # 分离源文件的完整文件名得到文件名和扩展名

         fileName, fileExtName = os.path.splitext(fileFullName)

         # 保存图片

         simage.save('{}{}_{}{}'.format(fileDirectory, fileName,'Nude' if self.result else 'Normal', fileExtName))

 if __name__ == "__main__":

     import argparse

     parser = argparse.ArgumentParser(description='Detect nudity in images.')

     parser.add_argument('files', metavar='image', nargs='+',

                         help='Images you wish to test')

     parser.add_argument('-r', '--resize', action='store_true',

                         help='Reduce image size to increase speed of scanning')

     parser.add_argument('-v', '--visualization', action='store_true',

                         help='Generating areas of skin image')

     args = parser.parse_args()

     for fname in args.files:

         if os.path.isfile(fname):

             n = Nude(fname)

             if args.resize:

                 n.resize(maxheight=800, maxwidth=600)

             n.parse()

             if args.visualization:

                 n.showSkinRegions()

             print(n.result, n.inspect())

         else:

             print(fname, "is not a file")

用法：python3 nude.py -v 1.jpg

转载：https://www.shiyanlou.com/courses/589/labs/1964/document/

python小项目（python实现鉴黄）源码的更多相关文章

python小工具myqr生成动态二维码
python小工具myqr生成动态二维码 (一)安装 (二)使用 (一)安装命令: pip install myqr 安装完成后,就可以在命令行中输入 myqr 查看下使用帮助: myqr --he ...
python附录-builtins.py模块str类源码（含str官方文档链接）
python附录-builtins.py模块str类源码 str官方文档链接:https://docs.python.org/3/library/stdtypes.html#text-sequence ...
Python机器学习经典实例电子版和附带源码
Python机器学习经典实例电子版和附带源码下载:https://pan.baidu.com/s/1m6ODNJk--PWHW8Vdsdjs-g 提取码:nyc0 分享更多python数据分析相关电 ...
百度ueditor vue项目应用 -- 图片上传源码修改
本文目的有两个,一.废掉单图上传,二.改造多图上传大家都知道百度ueditor不是针对vue项目开发的,官方文档提供的源码包里有需要后端配置的接口,but到vue项目就不太好办了,网上有些文章也介绍 ...
Spring3 + Spring MVC+ Mybatis 3+Mysql 项目整合（注解及源码）
Spring3 + Spring MVC+ Mybatis 3+Mysql 项目整合(注解及源码) 备注: 之前在Spring3 + Spring MVC+ Mybatis 3+Mysql 项目整合中 ...
Python练手项目实例汇总（附源码下载）
今天给大家分享几个有趣的Python练手项目实例,希望对Python初学者有帮助哈~ 一.经典的俄罗斯方块 1. 绑定功能 1 # 绑定功能 2 class App(Frame): 3 def _ ...
基于Python的datetime模块和time模块源码阅读分析
目录 1 前言 2 datetime.pyi源码分步解析 2.1 头部定义源码分析 2.2 tzinfo类源码分析 2.3 date类源码分析 2.4 time类源码分析 2.5 timedelta ...
Appium+python自动化17-启动iOS模拟器APP源码案例
前言上一篇已经可以启动iOS模拟器上的safari浏览器了,启动app比启动浏览器要复杂一点,本篇以github上的源码为案例详细介绍如何启动iOS模拟器的app 一.clone源码 1.githu ...
Appium+python自动化17-启动iOS模拟器APP源码案例【转载】
前言上一篇已经可以启动iOS模拟器上的safari浏览器了,启动app比启动浏览器要复杂一点,本篇以github上的源码为案例详细介绍如何启动iOS模拟器的app 一.clone源码 1.githu ...
Python开发中国象棋实战（附源码）
Pygame 做的中国象棋,一直以来喜欢下象棋,写了 python 就拿来做一个试试,水平有限,电脑走法水平低,需要在下次版本中更新电脑走法,希望源码能帮助大家更好的学习 python.总共分 ...

随机推荐

python基础(5):格式化输出、基本运算符、编码问题
1. 格式化输出现在有以下需求,让⽤户输入name, age, job,hobby 然后输出如下所⽰: ------------ info of Alex Li ----------- Name : ...
Python中最常用的字符串方法！
字符串是字符序列.Python中内置的string类代表基于Unicode国际字符集的字符串.除了Python中常见的操作外,字符串还有一些专属于它们的附加方法.下图显示了所有这些可用的方法: Pyt ...
Thinkphp带表情的评论回复实例
基于Thinkphp开发的一个简单的带表情的评论回复实例,可以无限回复,适合新手学习或作为毕业设计作品等. 评论提交验证 $(".submit-btn").click(functi ...
解决pip使用异常No module named 'pip'
场景在使用pip进行升级时 python install --upgrade named pip 时提示: No module named pip 注: 博客: https://blog.csdn. ...
webpack打包配置禁止html标签全部转为小写
用webpack打包页面,发现html中特别写的用来给后端识别的大写标签全部被转为了小写标签,这时候需要将加一个配置 ,caseSensitive:true ,禁止大小写转换. webpack配置: ...
高版本 MySQL 导出的脚本到低版本 MySQL 中执行时报错
导入 MySQL 脚本时报错:[ERR] 1273 - Unknown collation: 'utf8mb4_0900_ai_ci'低版本还不支持 utfmb4 这个字符集解决方法:将 sql 脚 ...
使QScrollArea的背景透明，并且不影响子控件
使QScrollArea的背景透明,乍看很easy,其实却是一个目前百度上百不出来的问题; 最容易想到的,用qss: scrollArea->setStyleSheet("backgr ...
typora使用说明
一级标题 # 空格编写内容二级标题 ## 空格编写内容有序内容 1.+Tab 无序内容 -+Tab 代码块 print("hello wrold") typora快捷键 c ...
9.Java基础_for/while/do-while循环
/* for循环(同C++) 初始化变量的作用域为循环体出了循环体,初始化的局部变量消失 for(初始化;条件判断;条件控制){ 循环体; } while循环 while(条件判断){ 循环体; } ...
C++学习三模板类出错总结（Missing template arguments before 'L'）
一.模板类的说明模板类有一个好处是可以放宽你输入的数据类型. 比如有这样的一个函数: int add(int x, int y) { return x+y; } 这个函数对于int类型的x,y才适合 ...

python小项目（python实现鉴黄）源码

python小项目（python实现鉴黄）源码的更多相关文章

随机推荐

热门专题