开年以来,多个图像生成软件在全球迅速蹿红,其作画逼真程度“技惊四座”。AI一路“狂飙”,让生成、篡改等多形式的图片伪造的门槛变得更低,由此引发的隐患也令人忧虑。

图像是信息的主要载体之一,利用AI进行图像造假的行为,是AI可信化发展需要应对的重点问题。在本届世界人工智能大会(WAIC 2023)上,中国信息通信研究院(简称中国信通院)围绕“多模态基础大模型的可信AI”主题举办了专项论坛。论坛上,合合信息AI图像内容安全技术方案获得广泛关注。该方案可精准定位截图篡改痕迹,对生成式图片进行智能判别,防止不法分子利用技术手段非法爬取图片上的信息。

图说:合合信息智能创新事业部总经理唐琪现场介绍合合信息AI图像安全技术应用

用AI守护AI图像内容安全,合合信息新技术很“实用”

去年的人工智能大会上,合合信息首次展示了“PS篡改检测”技术,“像素级”的识别精确度让现场参观者感叹,在识别证件、票据等各类重要的商业材料中的PS痕迹方面,AI真的是“火眼金睛”。

 图说:合合信息AI图像篡改检测技术应用效果展示

今年,AI图像篡改检测“黑科技”持续优化升级,应用面也拓展至“截图篡改检测”。相较于去年的自然场景图像,对用户生活影响更大的资质证书、文档合同、银行保单等截图若被不法分子利用,所承受的财产损失难以估量。

据了解,升级后的AI图像篡改检测技术可检测包括转账记录、交易记录、聊天记录等多种截图,无论是从原图中“抠下”关键要素后移动“粘贴”至另一处的“复制移动”图片篡改手段,还是“擦除”“重打印”等方式,图像篡改检测技术均可“慧眼”识假

图说:“重打印”篡改图片检测示例:将一张图片输入到合合信息AI图像篡改检测模型中,模型便能够判别这张图像是否被篡改,并且定位图像的篡改区域

该技术的主要难点在于,与证照篡改检测相比,截图的背景没有纹路和底色,整个截图没有光照差异,难以通过拍照时产生的成像差异进行篡改痕迹判断,现有的视觉模型通常难以充分发掘原始图像和篡改图像的细粒度差异特征。

为此,合合信息提出了一种基于HRNet的编码器-解码器结构的图像真实性鉴别模型,结合图像本身的信息,包括但不限于噪声、频谱等, 从而捕捉到细粒度的视觉差异,达到高精度鉴别效果。

针对频上“热搜”的AIGC话题,合合信息研发了关于AI生成图片鉴别技术,用于判断图片是否由AI生成。AIGC生成图像识别的一大难点在于AI生成的图像场景繁多,机器难以判别。合合信息基于空域与频域关系建模,能够利用多维度特征来分辨真实图片和生成式图片的细微差异。

此外,合合信息对OCR对抗攻击技术展开了创新性的研究。当人们在网上发送含有个人信息的图片时,这些资料包含的信息很可能被不法分子使用OCR技术提取并泄露。OCR对抗攻击技术可对场景文本或者文档内文本进行扰动,为个人或企业的重要文件“上锁”,防止第三方通过OCR系统读取并保存图像中所有的文字内容,降低数据泄露的风险,达到保护隐私信息的目的。

图说:合合信息OCR对抗攻击技术应用效果展示,可对关键信息进行遮盖,在不影响肉眼观看的情况下阻止机器自动爬取

推动图像内容安全行业发展标准建立,助力可信AI系统化落地

中国信通院发布的《人工智能白皮书(2022年)》中提到,人工智能正在迈入“创新驱动、应用深化、规范发展”的新阶段。可信AI的实现,需要政府、企业、高校等多方力量的协同。行业标准的制定,或将为中国“可信AI”在机器视觉、图像处理领域的体系建设提供有力支持。

为贯彻落实《中华人民共和国网络安全法》《生成式人工智能服务管理办法(征求意见稿)》等文件中对于AI服务的规范性要求,系统性建立图像内容安全行业发展秩序,今年6月,中国信通院牵头启动了《文档图像篡改检测标准》制定工作,合合信息、中国图像图形学学会、中国科学技术大学等科技创新企业及知名学术机构联合参与编制。

据悉,该项标准将基于产业现状,围绕“细粒度”视觉差异伪造图像鉴别、生成式图像判别、文档图像完整性保护等行业焦点议题,凝聚行业共识,以期为行业提供有效指引。合合信息智能创新事业部总经理唐琪在论坛分享中表示,《文档图像篡改检测标准》制定项目的启动,是AI图像内容安全体系建设之路上的重要的里程碑。期待更多研究机构、企业主体参与进来,共同推动AI服务规范性的整体提升和行业发展秩序的建立,助力科技向上而行,向善发展。

可信AI的健康发展,除了标准引领,也需要“硬科技”支撑。合合信息深耕智能文字识别、智能图像处理领域,技术成果获权威机构及市场认可。最近一个月内,公司智能文档处理产品通过中国信通院“可信AI—智能文档处理系统”评估工作,并获得“5级”评定。“5级”为该模块最高评定等级。

目前,合合信息AI技术已落地于银行、保险、证券、制造、政务等近30个行业,服务全球超过200个国家和地区的个人及企业用户。未来,合合信息将与学术、产业合作伙伴共同助力AI图像内容行业的安全和可信发展,打造上海人工智能发展的亮丽名片。

合合信息AI图像内容安全新技术亮相WAIC2023,防范“生成式造假”的更多相关文章

  1. 【前端优化之拆分CSS】前端三剑客的分分合合

    几年前,我们这样写前端代码: <div id="el" style="......" onclick="......">测试&l ...

  2. NVIDIA | 一种重建照片的 AI 图像技术

    简评:或许可以称之为「擦擦乐」~ 建议大家看看视频示例 ~ 前几天,NVIDIA 的研究人员介绍了一种新的 深度学习 方法,使用该方法可以重建缺失像素的图像内容. 这种方法被称为「image inpa ...

  3. 解密优酷智能生产技术,看 AI 赋能内容数字化

    2021 年,随着社会节奏的加快,用户碎片化消费时间不断增加,当前短视频的消费用户规模已超 7.73 亿人,短视频的市场规模超过 2000 亿元.短视频行业发展迅速,但也存在低质内容泛滥,精品内容稀缺 ...

  4. 带你从0到1开发AI图像分类应用

    摘要:通过一个垃圾分类应用的开发示例,介绍AI Gallery在AI应用开发流程中的作用. 本文分享自华为云社区<AI Gallery:从0到1开发AI图像分类应用>,作者: yd_269 ...

  5. 游戏AI系列内容 咋样才能做个有意思的AI呢

    游戏AI系列内容 咋样才能做个有意思的AI呢 写在前面的话 怪物AI怎么才能做的比较有意思.其实这个命题有点大,我作为一个仅仅进入游戏行业两年接触怪物AI还不到一年的程序员来说,来谈这个话题,我想我是 ...

  6. 网页调试技巧:抓取马上跳转的页面POST信息或者页面内容

    http://www.qs5.org/Post/625.html 网页调试技巧:抓取马上跳转的页面POST信息或者页面内容 2016/02/02 | 心得分享 | 0 Replies 有时候调试网页或 ...

  7. stat - 打印信息节点(inode)内容

    SYNOPSIS(总览) stat filename [filenames ... ] DESCRIPTION(描述) stat 打印出一个信息节点的内容,它们显示为对人可读的格式的stat(2). ...

  8. Tidyverse|数据列的分分合合,爱恨情仇

    Tidyverse|数据列的分分合合,爱恨情仇 本文首发于“生信补给站”Tidyverse|数据列的分分合合,一分多,多合一 TCGA数据挖掘可做很多分析,前期数据“清洗”费时费力但很需要. 比如基因 ...

  9. 【Python自动化Excel】pandas处理Excel的“分分合合”

    话说Excel数据表,分久必合.合久必分.Excel数据表的"分"与"合"是日常办公中常见的操作.手动操作并不困难,但数据量大了之后,重复性操作往往会令人崩溃. ...

  10. 【Python自动化Excel】pandas操作Excel的“分分合合”

    话说Excel数据表,分久必合.合久必分.Excel数据表的"分"与"合"是日常办公中常见的操作.手动操作并不困难,但数据量大了之后,重复性操作往往会令人崩溃. ...

随机推荐

  1. TP3.2与TP5.0的区别

    1. 控制器输出return $this->fetch(); ----5$this->display(); ----3.2单字母函数去掉了 如:M() D() U() S() C() 3. ...

  2. vue --version 显示的却是vue cli的版本号,为什么?

    vue --version 显示的却是vue cli的版本号,为什么? 如果您在运行 vue --version 命令时显示的是 Vue CLI 的版本号,而不是 Vue.js 的版本号,那可能是因为 ...

  3. oeasy 教您玩转 linux 010207 黑客帝国 matrix

    我们来回顾一下 上一部分我们都讲了什么? 蒸汽机车sl 变身小机车-l 变身飞天机车-F 让我们再开一次车 sl 上次还想看看黑客帝国来着?! 黑客帝国Matrix apt search matrix ...

  4. [oeasy]python0026_刷新时间_延迟时间_time_sleep_死循环_while_True

    ​ 刷新时间 回忆上次内容 time 是一个 ​​module​ import 他可以做和时间相关的事情 time.time() 得到当前时间戳 time.localtime() 得到本地时间元组 l ...

  5. [oeasy]教您玩转python - 0006 - 自由软件运动和开源运动

    ​ 顺序执行 回忆上次内容 上次写了10000行代码 10000行代码 都是写在明面上的 人家一下载​​py​​ 文件 就能看个明明白白 修改或者运行程序都很方便 这程序全都这么公开出来 大家随意修改 ...

  6. oeasy教您玩转vim - 67 - # 批量替换

    ​ 批量替换 回忆上次 我们可以用vimdiff快速的比较文件 这很实用!!! 实用的一些跳转方式 遍历所有的修改change ]c 下一条修改 [c 上一条修改 遍历所有的函数method ]m 下 ...

  7. CF916C 题解

    CF916C 题解 思路 思考发现,如果我们让很多边的边权变得非常大,而故意留下 \(1\) 到 \(n\) 的某一条路径,使整条路径之和甚至还没有剩下一条边的权值大,这条路径显然就是最短路了. 更重 ...

  8. 【Tutorial C】04 基本输入输出

    输出单个字符 putchar('a'); // 字符输出函数,其功能是在终端(显示器)输出单个字符. putchar('\n'); // 支持转义换行 putchar(77); // 可以直接注入AS ...

  9. AI开源是否应该完全开源?AI的完全开源是否可以实现?

    看了一个视频: 袁进辉:零代码改动,加速AIGC 里面提到了一个完全开源的概念,感觉有些意思,虽然觉得可实现性不高,嘿嘿嘿!!! AI的完全开源: 训练数据开源.数据清洗过程开源.模型权重开源.项目代 ...

  10. 【转载】 传统PID算法解决不了的情况,应该怎么办?

    原文地址: http://www.51hei.com/bbs/dpj-152844-1.html --------------------------------------------------- ...