初探机器学习之使用百度AI服务实现图片识别与相似图片
一、百度云AI服务
最近在调研一些云服务平台的AI(人工智能)服务,了解了一下阿里云、腾讯云和百度云。其中,百度云提供了图像识别及图像搜索,而且还细分地提供了相似图片这项服务,比较符合我的需求,且百度云提供了每日10000次入库和500次检索的免费次数,使得我可以更快地试用,且没有任何花费。更为重要的是,百度云提供了兼容.NET Core 2.0的C# SDK,这是更加让我选择试用的原因。
这里抛开BAT各个AI服务提供的算法的精准度不说,百度的AI服务的友好度还是蛮高的。废话不多说,这里我主要试用百度AI的两个服务:
(1)图像识别
图像识别服务是百度基于深度学习及大规模图像训练,准确识别图片中的物体类别、位置、置信度等综合信息。它的主要应用场合在于:图片内容检索及相册分类或智能美图这种场景。
(2)图像搜索
图像搜索是指以图搜图,在指定图库中搜索出相同或相似的图片。这里我主要Focus在了试用相似图片搜索这个子功能,即从一堆图片里(这堆图片是我自己建立的一个图像库)找到跟我指定的一张图片最相似的一些其他图片。
关于百度云AI C# SDK
百度云AI C# SDK在2018年中旬开始支持了.NET Core 2.0,我们可以通过Nuget安装它:
接下来要做的就是,根据文档的示例完成Demo。
二、图片内容识别
2.1 内容识别实现
代码很简单,直接调用SDK提供的API即可实现图片识别:
public class Program
{
private static ImageClassify aipClassifyClient; static Program()
{
aipClassifyClient = new ImageClassify(BaiduAipSimSettings.ApiKey, BaiduAipSimSettings.SecretKey);
} public static void Main(string[] args)
{
var filePath = @"Images\bk.jpg"; // 图片识别Demo
ImageClassifyDemo(filePath); Console.ReadKey();
} private static void ImageClassifyDemo(string filePath)
{
var image = File.ReadAllBytes(filePath); try
{
var result = aipClassifyClient.AdvancedGeneral(image);
Console.WriteLine("Api Response :");
Console.WriteLine(result);
}
catch (Exception ex)
{
Console.WriteLine(ex.Message);
}
}
}
其中,ApiKey和SecretKey是我们在百度云平台申请的账号,可以在管理中心找到:
2.2 内容识别测试
(1)人物:贝克汉姆
从分析结果中看出,前三个结果是最接近的Topic。
(2)静物:室内客厅
接下来来一个复杂一点的客厅照片,看看结果如何:
可以看到,识别结果的自我评分都不太高,我想要的是“客厅”,但是只识别出来了“装修效果图”,还需要多多学习。
三、获取相似图片
3.1 准备图片库
首先,我们需要准备一个图片库,在百度云管理中心创建这个图片库,然后通过Web管理界面或者SDK上传上去:
这里我只上传了100多张图片,实际中应该根据自己的业务场景上传尽可能多的图片。需要说的是,在上传时可以为每个图片添加Tags,这个Tags只能是两个整数(API要求),也就是你本地数据库中的一些ID,比如分类ID。另外就是,对于Brief属性,我们一般可以传递一个JSON字符串进去,可以包含ID、Name以及Url,这样当你获取结果之后可以直接使用这个Brief属性进行反序列化,拿到URL等信息。
3.2 获取相似图片实现
代码仍然很简单,如下:
public class Program
{
private static ImageSearch aipSearchClient; static Program()
{
aipSearchClient = new ImageSearch(BaiduAipSimSettings.ApiKey, BaiduAipSimSettings.SecretKey);
} public static void Main(string[] args)
{
var filePath = @"Images\卧室.jpg"; // 相似图片Demo
SimilarImageDemo(filePath); Console.ReadKey();
} private static void SimilarImageDemo(string filePath)
{// 检索
var searchOptions = new Dictionary<string, object>{
{"tags", "100,1"},
{"tag_logic", ""},
{"pn", ""},
{"rn", ""}
};
SimilarSearchFromLib(filePath, searchOptions);
} /// <summary>
/// 单张图片入库
/// </summary>
private static void ImportToLib(string filePath, Dictionary<string, object> options = null)
{
var image = File.ReadAllBytes(filePath); try
{
var result = aipSearchClient.SimilarAdd(image, options);
Console.WriteLine("Api Response :");
Console.WriteLine(result);
}
catch (Exception ex)
{
Console.WriteLine(ex.Message);
}
} /// <summary>
/// 相似图检索
/// </summary>
private static void SimilarSearchFromLib(string filePath, Dictionary<string, object> options = null)
{
var image = File.ReadAllBytes(filePath); try
{
var response = aipSearchClient.SimilarSearch(image, options).ToObject<SearchResponse>(); var result = response.Result.Take();
Console.WriteLine("Similarity Result :");
foreach (var item in result)
{
Console.WriteLine("{0}:{1}", item.Brief, item.Score);
}
}
catch (Exception ex)
{
Console.WriteLine(ex.Message);
}
}
}
直接参考API文档示例即可。
3.3 获取结果测试
测试图片:简约沙发
测试效果如下图所示:
可以看到,它将最相似的图片(全是沙发,当然我的图库里可是沙发、床、椅子、灯具啊啥的都有)都分析出来了:这里我只取了Brief属性,实际中它应该是一个JSON字符串,反序列化后就可以得到URL去获取真正的图片了。
四、小结
本文是一个简单的百度云AI服务SDK的使用,没有过多关注算法和其他方面,只是一个简单的笔记说明,也希望我们.NET程序员能够多多借助云平台提供的AI服务实现自己的业务智能化实践。后续我会学习学习ML.NET,来玩玩机器学习。
参考资料
百度云,《C# SDK技术文档》
初探机器学习之使用百度AI服务实现图片识别与相似图片的更多相关文章
- 初探机器学习之使用百度EasyDL定制化模型
一.Why 定制化模型 一般来说,各大云服务厂商只会提供一些最常见通用的AI服务,针对具体场景的AI应用则需要在云服务厂商提供的服务之上进行定制.例如,通常的图像识别只能做到分析照片的主题内容,而我的 ...
- 用百度AI的OCR文字识别结合JAVA实现了图片的文字识别功能
第一步可定要获取百度的三个东西 要到百度AI网站(http://ai.baidu.com/)去注册 然后获得 -const APP_ID = '请填写你的appid'; -const API_KEY ...
- c# 利用AForge和百度AI开发实时人脸识别
baiduAIFaceIdentify项目是C#语言,集成百度AI的SDK利用AForge开发的实时人脸识别的小demo,里边包含了人脸检测识别,人脸注册,人脸登录等功能 人脸实时检测识别功能 思路是 ...
- 小白学Python——用 百度AI 实现 OCR 文字识别
百度AI功能还是很强大的,百度AI开放平台真的是测试接口的天堂,免费接口很多,当然有量的限制,但个人使用是完全够用的,什么人脸识别.MQTT服务器.语音识别等等,应有尽有. 看看OCR识别免费的量 快 ...
- 微信开发+百度AI学习:植物识别
直接上代码 服务端代码如下 private static readonly Baidu.Aip.ImageClassify.ImageClassify client = new Baidu.Aip.I ...
- 利用百度AI OCR图片识别,Java实现PDF中的图片转换成文字
序言:我们在读一些PDF版书籍的时候,如果PDF中不是图片,做起读书笔记的还好:如果PDF中的是图片的话,根本无法编辑,做起笔记来,还是很痛苦的.我是遇到过了.我们搞技术的,当然得自己学着解决现在的痛 ...
- python基于百度AI开发文字识别
很多场景都会用到文字识别,比如app或者网站里都会上传身份证等证件以及财务系统识别报销证件等等 第一步,你需要去百度AI里去注册一个账号,然后新建一个文字识别的应用 然后你将得到一个API Key 和 ...
- 初探机器学习之使用讯飞TTS服务实现在线语音合成
最近在调研使用各个云平台提供的AI服务,有个语音合成的需求因此就使用了一下科大讯飞的TTS服务,也用.NET Core写了一个小示例,下面就是这个小示例及其相关背景知识的介绍. 一.什么是语音合成(T ...
- 百度AI开发平台简介
AIstudio https://aistudio.baidu.com/aistudio/index 关于AI Studio AI Studio是基于百度深度学习平台飞桨的一站式AI开发平台,提供在线 ...
随机推荐
- HTML学习笔记3:文字和段落
①标题标签 <h1></h1> ~ <h6></h6>分别对应字体不同的大小,数字又小到大对应字体由大到小 ②段落 <p> ...
- JSON-RPC远程调用协议
1. JSON-RPC简介 2. 请求 3. 响应 4. 错误 4.1. 错误对象 4.2. 错误码 5. 批量调用 6. 示例 6.1. 列表形式参数 6.2. key-value形式参数 6.3. ...
- asp.net 六大对象之Request、Response
ASP.NET的六大对象,本质上只是 Context 里面的属性,严格上不是对象. 1.Request-->读取客户端在Web请求期间发送的值 2.Response-->封装了页面执行期后 ...
- 【Android学习笔记】Android Studio简单断点调试
首先点击断点调试按钮运行App 启动之后,会弹出如下图的提示框,不要管,几秒之后这个弹框会自动消失,然后App会成功运行. 下面介绍一下断点调试的相关操作按钮对应的功能: 按钮1的功能:从当前断点跳到 ...
- Shiro入门之二 --------基于注解方式的权限控制与Ehcache缓存
一 基于注解方式的权限控制 首先, 在spring配置文件applicationContext.xml中配置自动代理和切面 <!-- 8配置自动代理 --> <bean cl ...
- Tiny4412MMU内存管理
MMU是Memory Management Unit的缩写,中文名是内存管理单元,MMU是由ARM芯片中的cp15协处理器管理,它的作用是负责虚拟内存到物理内存的映射 要将虚拟内存映射为物理内存,就要 ...
- linux 下 Emacs dired 模式 隐藏 dot file ".filename" 文件
有时候 emacs 下调用 C-x dired 是挺方便的一个事,但是一堆的点文件(linux下以"."为前缀的文件,即隐藏文件)让人目不暇接,打算隐藏之. 参考如下: 最主要的是 ...
- HBuilder 插件开发(openinstall 集成)
离线打包 如果要集成使用非基座包下的第三方 SDK,就必须使用离线打包.可以参考 官方文档 进行离线打包,如果嫌官方文档看不懂,可以查看 其他技术人员的教程 开发插件 编写 Android 原生代码 ...
- mongo Shell初体验
mongo shell是一个MongoDB的交互式JavaScript接口.您可以使用mongo shell来查询和更新数据以及执行管理操作. 打开cmd命令行,输入mongo,就可以进入mongo ...
- 手把手教你使用 netlify 实现前端的 自动部署 + HTTPS
随着开源工具越来越多,特别是nodejs构建微服务器之快,实现前端自动化部署越来越简单了,有可能[10行js代码+10行sh脚本+设置github的webhook]就能实现,但是如果你和我一样,就是& ...