实现效果:

该AI智能小程序目前集成了百度AI开放平台数十个AI服务产品功能,包括人脸识别、文字识别、表格识别、红酒识别、货币识别、地标识别、手势识别、商标识别、果蔬识别、菜品识别等图片识别功能,以及黑白图像上色、图片风格变换等图像处理的功能。

1 系统框架

小程序将常用功能按Ai技术分为五大类:文字识别、语音技术、图像技术、视频技术和自然语言处理(NLP),然后根据具体功能再进行细分。本文主要介绍百度AI开放平台计算机视觉方面服务产品的测试过程及效果。通过微信小程序实现API调用。小程序将用户上传的图片提交给百度AI服务,返回识别结果。全部功能都在小程序客户端完成,不需要服务器,适合个人开发者学习调试使用,同时也为商业应用提供相应解决方案。

开发平台:微信开发者工具 V1.02

开发语言:java script

测试环境:Andriod 9.0

2 微信小程序开发过程

2.1注册微信小程序

注册地址:https://mp.weixin.qq.com/cgi-bin/registermidpage?action=index&lang=zh_CN

注册成功后在开发->开发者ID里找到AppID,这是开发微信小程序所需要的身份标识。然后填写服务器域名,需要用到的均要填上,如下图。

2.2 小程序的配置已基本完成,下一步需要下载开发工具了,微信自己开发的IDE,下载地址是:
https://developers.weixin.qq.com/miniprogram/dev/devtools/download.html

2.3小程序开发文档:https://developers.weixin.qq.com/miniprogram/dev/framework/

2.4小程序开发界面

如下图,标红处需要填入注册时获得的APPID。

2.5程序总体结构

Pages下的每个文件夹对应实现一种AI功能。添加新的AI功能,比如添加驾驶证识别功能,在根目录的全局配置文件app.json中增加:"pages/ driving_license/ driving_license" ,会自动创建相关页面文件夹,其内部结构如下:

driving_license.js:功能逻辑模块

driving_license.wxss:页面样式文件

driving_license.wxml:页面布局文件

driving_license.json:页面配置文件

3 程序功能实现说明

想了解微信小程序中百度API接口的调用过程,请参看我之前的帖子:

营业执照识别:https://ai.baidu.com/forum/topic/show/956171

增值税发票识别:https://ai.baidu.com/forum/topic/show/956168

车牌识别:https://ai.baidu.com/forum/topic/show/956167

手写文字识别:https://ai.baidu.com/forum/topic/show/956153

图像风格转换:https://ai.baidu.com/forum/topic/show/956135

文字识别:https://ai.baidu.com/forum/topic/show/954152

iOCR财会版:https://ai.baidu.com/forum/topic/show/956136

当然,还有更多百度AI服务功能可以陆续添加,按照以上文章链接所提供的方法稍作修改即可。有兴趣的同学可以试试。

4 测试效果

以下选取了部分图片识别的测试效果:

4.1菜品识别

4.2 车型识别

4.3地标识别

4.4动物识别

4.5红酒识别

4.6 货币识别

4.7 植物识别

4.8 黑白图像上色

4.9 清点人数

4.10 通用物体与场景识别

5 测试结论

5.1识别能力

根据拍摄照片,识别图片内容,广泛应用于娱乐类APP,自助结算等业务场景中。目前图像识别具备的识别能力如下:

品牌logo识别 :识别4万种商品logo,支持定制logo图库

植物识别 :识别2万多种通用植物和近8千种花卉

动物识别 :识别近8千种动物

菜品识别 :识别超过近九千种菜品,支持定制菜品图库

地标识别 :识别5万中外著名地标、景点

果蔬识别 :识别近千种水果和蔬菜

红酒识别 :识别数十万中外红酒名称及详细介绍

货币识别 :识别国内外常见货币,支持正反面、纪念钞

车型识别 :识别3千款常见车型,可返回车型百科信息

营业执照识别 :识别各版式营业执照所有关键字段

增值税发票识别 :识别增值税普票或专票所有30个字段

驾驶证识别 :识别机动车驾驶证正本所有9个字段

车牌识别 :识别蓝牌、绿牌、单/双行黄牌等类型车牌

手写文字识别 :识别图片中的手写数字、手写中文

表格文字识别 :识别表头、表尾及每个单元格的文字内容

人脸检测 :返回人脸框与关键点,识别多种人脸属性

手势识别 :识别24种常见手势,支持自拍、他人拍摄

5.2 特色优势

1)图像识别功能丰富

支持多种垂类业务场景的细粒度图像识别,精准识别超过十万种物体和场景,基于百度海量数据,持续丰富接口返回内容信息。

2)识别准确性高

基于百度丰富的海量数据,利用深度学习技术及精准的算法迭代模型,不断提高准确性。

3)工作稳定性好

提供24小时云端高稳定服务,宕机率低,故障恢复快,单图毫秒级响应,服务可用性高达99.95%。

4)支持定制化识图

支持根据不同的业务场景定制客户专属的AI识图能力,满足非通用场景下的业务需求。例如品牌logo,菜品识别均可自定义库。

5)支持获取百科信息

支持识别结果中返回百度百科的内容,让客户业务功能更完善、内容更丰富。

作者:wangwei8638

如何快速将百度大脑AI技术内置智能小程序中的更多相关文章

  1. 综合5项百度大脑AI技术,快速构建智能交通方案

    一.整体方案:思路:整合百度AI功能,通过百度AI解决.优化在公交运行过程中遇到的运营.管理.安全等方面的问题.具体如下: 安全方面:通过驾驶员检测+语音合成,对驾驶员状态进行实时检测,跟踪,告警.  ...

  2. 百度智能小程序弹窗组件wcPop|智能小程序自定义model弹窗模板

    百度智能小程序自定义弹窗组件wcPop|百度小程序model对话框|智能小程序弹窗界面模板 最近百度也推出了自己的智能小程序,如是就赶紧去试了下,官方提供的api还不是狠完整.而且官方提供的弹窗组件也 ...

  3. AI+教育落地,百度大脑如何让校园更智能?

    人工智能作为影响社会底层技术革命逐渐向传统行业渗透,“AI+”已经替代“互联网+”成为创业创新的新引擎,出人意料的是,在AI在教育业的率先落地并且相当火爆. 现在,人工智能教育已成为从业者心目中的“教 ...

  4. 利用百度AI快速开发出一款“问答机器人”并接入小程序

    先看实现效果: 利用百度UNIT预置的智能问答技能和微信小程序,实现语音问答机器人.这里主要介绍小程序功能开发实现过程,分享主要功能实现的子程序模块,都是干货! 想了解UNIT预置技能调用,请参看我之 ...

  5. 6.19-response(响应),session(会话技术,服务器端技术) 内置对象,application(内置对象),pageContext (内置对象),cookie(客户端技术)

    一.response(响应) 页面重定向 response.sendRedirect(""); 转发: request.getRequestDispatcher("&qu ...

  6. 腾讯技术分享:微信小程序音视频与WebRTC互通的技术思路和实践

    1.概述 本文来自腾讯视频云终端技术总监rexchang(常青)技术分享,内容分别介绍了微信小程序视音视频和WebRTC的技术特征.差异等,并针对两者的技术差异分享和总结了微信小程序视音视频和WebR ...

  7. 腾讯技术分享:微信小程序音视频技术背后的故事

    1.引言 微信小程序自2017年1月9日正式对外公布以来,越来越受到关注和重视,小程序上的各种技术体验也越来越丰富.而音视频作为高速移动网络时代下增长最快的应用形式之一,在微信小程序中也当然不能错过. ...

  8. 【Web技术】281- 滴滴开源小程序框架 Mpx2.0

    滴滴Mpx框架负责人@hiyuki,滴滴出行网约车webapp乘客团队的负责人,也是滴滴开源的小程序框架Mpx的负责人和核心作者 Mpx是一款致力于提高小程序开发体验和效率的增强型小程序框架,目前在滴 ...

  9. 技术博客——微信小程序的架构与原理

    技术博客--微信小程序的架构与原理 在两个月的微信小程序开发过程中,我曾走了不少弯路,也曾被很多现在看来十分可笑的问题所困扰.这些弯路与困扰,基本上都是由于当时对小程序的架构理解不够充分,对小程序的原 ...

随机推荐

  1. Paramiko的SSH和SFTP使用

    目录 1. 概述 2. Paramiko的基本使用 2.1 SSHClient关键参数介绍 2.2 SSHClient常用示例 2.2.1 通过用户名和密码方式登陆: 2.2.2 通过用户名和密码方式 ...

  2. 纵论WebAssembly,JS在性能逆境下召唤强援

    webassembly的作用 webassembly是一种底层的二进制数据格式和一套可以操作这种数据的JS接口的统称.我们可以认为webassembly的范畴里包含两部分 wasm: 一种体积小.加载 ...

  3. Java中我常用到的十二个最基本的快捷键

    自己在Java中经常用到的快捷键先记下来方便日后学习之用: 1. Ctrl+shift+r:打开资源 这可能是所有快捷键组合中最省时间的了.这组快捷键可以让你打开你的工作区中任何一个文件,而你只需要按 ...

  4. apache虚拟主机配置的3种方式

    Apache的虚拟主机功能 (Virtual Host) 是可以让一台服务器基于IP.主机名或端口号实现提供多个网站服务的技术. 下面我介绍一下这3种方式具体的配置流程: 一.基于ip地址 首先我们需 ...

  5. python 备忘录

    1. python 变量 区分大小写 2. 字符串可以用   'X'  "X"  '''X'''  """X""" 3. ...

  6. 2019-2020-7 20199317《Linux内核原理与分析》第七周作业

    第6章  进程的描述和进程的创建 1  进程的描述       操作系统内核实现操作系统的三大管理功能,即进程管理.内存管理和文件系统.其中,操作系统内核中最核心的功能是进程管理.为了管理进程,内核要 ...

  7. 【并发技术16】线程同步工具Exchanger的使用

    如果两个线程在运行过程中需要交换彼此的信息,比如一个数据或者使用的空间,就需要用到 Exchanger 这个类,Exchanger 为线程交换信息提供了非常方便的途径,它可以作为两个线程交换对象的同步 ...

  8. 转:Eclipse中创建Maven版的Web工程(详解)

    一.搭建步骤 ♦首先创建一个Maven的Project,如下图: ♦点击Next,勾选 Create a simple project ♦点击Next,注意Packing要选择war,因为我们创建的是 ...

  9. shell ssh 远程机器 追加文件内容

    在host1上,把下面的两行内容通过ssh追加到host2上的/etc/ca-certificates.conf文件中 I am a student Are you ok ssh host2 &quo ...

  10. 洛谷 P2254 [NOI2005]瑰丽华尔兹(单调栈优化DP)

    题目描述 不妨认为舞厅是一个N行M列的矩阵,矩阵中的某些方格上堆放了一些家具,其他的则是空地.钢琴可以在空地上滑动,但不能撞上家具或滑出舞厅,否则会损坏钢琴和家具,引来难缠的船长.每个时刻,钢琴都会随 ...