HMS Core Discovery第16期回顾|与虎墩一起,玩转AI新“声”态
HMS Core 在AI领域最新的技术能力有哪些?本期Discovery直播以《与虎墩一起,玩转AI新“声”态》为主题,邀请了HMS Core 机器学习服务产品经理、机器翻译高级专家以及HMS Core的新朋友“虎墩”,为大家展示机器学习的语音语言创新技术,分享机器学习与人工智能的宏观发展趋势。一起回顾一下本期精彩内容!
【精彩回顾】
1、抖音网红IP“虎墩小镖师”强势来袭
2、同声传译新亮相,底层技术大揭秘
3、AI翻译能力升级,语种扩充可播报
【专家观点】
Nicolas,华为2012实验室文本机器翻译高级专家
机器翻译暂时无法替代人类。目前需求不高的翻译需求可以依赖机器但要求较高的翻译需求还需要人工介入,人工可以做到点到面的全方位质量把控,比如说话地道与否、语言通顺与否,还可以贡献数据和知识,提升机器翻译质量。
Hardy,HMS Core ML Kit 资深产品经理
AI是智能机器的广义领域,而机器学习是AI的核心应用之一。它指的是任何能够自行“学习”的计算机应用程序或程序,而无需人类的明确规则。未来机器学习技术将会更注重情感体验,向多模态(语音、文字、视觉)、多技术(VR/AR等)、多平台多系统协同态势的方向发展。
【精彩答疑】
Q1:什么是TTS音色定制?TTS音色定制与虎墩在碰撞一起会有什么新玩法?
A:依托华为的数据积累和成熟算法,TTS音色定制在语音合成技术的加持下,只需要提供少量的干净录音数据,就可以进行模型训练,得到高还原度、高清晰度、高稳定性的专属音库,助于提升产品特色、快速打造个性化的品牌特色。ML Kit的新能力TTS与 IP“虎墩小镖师”正在合作中,TTS通过机器训练还原虎墩的音色,后续将逐步开放虎墩音色给开发者使用,助力开发者应用在各类个性化场景。
Q2:机器学习服务提供的翻译和同声传译能力,如何赋能App打造新“声”态?
A:文本翻译能力解决了用户因语言不通而导致交流不畅的痛点。比如通话场景,经过实时语音识别,可以快速将识别的文字转化为目标语言文字;阅读场景,支持提词翻译器功能,帮助用户快捷看到译文;视频类App集成文本翻译服务后,用户可以流畅体验AI实时字幕功能。通过对语音识别、机器翻译、语音合成三项技术的有机整合,同声传译能力有较低时延、较高准确率的特性,适用于会议、直播、演讲等实时性高的场景,支持应用将音频内容实时输出为目标语言文字,生成双语字幕,同时对目标语言文本进行实时播报,降低理解成本,兼具质量与效率。
Q3:除以上语音语言类能力,机器学习服务有新推出其它创新能力吗?
A:在金融电商领域,机器学习服务还提供了活体检测能力。动作活体检测能力使用人脸关键点定位和人脸追踪等技术,通过指令配合动作的形式可以验证用户是否为真实活体本人操作。在银行、证券和借贷等实名制和安全性要求较高的金融领域,活体检测可作为用户远程注册和密码找回环节中的辅助验证,帮助用户甄别欺诈行为,有效抵御攻击行为,保障业务安全。
Q4:机器学习的宏观技术发展趋势是怎样的?
A:首先,机器学习会更加注重情感体验。机器将具有识别、理解和表达喜怒哀乐的能力,识别用户的需求以及环境信息的变化,理解人的情感意图,做出适当反应;其次,是多模态的发展。深度学习技术正从语音、文字、视觉等单模态向学习多模态智能学习发展。未来甚至可以对嗅觉、味觉、心理学等难以量化的信号进行融合,实现多个模态的联合分析,在更多场景、更多业务上辅助人类工作;再次,是多技术的融合,比如VR/AR以及元宇宙等。相信未来AI还将呈现多平台多系统协同态势,以实现更为广泛的赋能,将通用平台、行业平台和端侧应用的协同组合,以软硬一体的方式实现具体应用的功能定制和扩展。
欢迎登录HMS Core机器学习服务首页了解更多技术细节。
了解更多详情>>
访问华为开发者联盟官网
获取开发指导文档
华为移动服务开源仓库地址:GitHub、Gitee
关注我们,第一时间了解 HMS Core 最新技术资讯~
HMS Core Discovery第16期回顾|与虎墩一起,玩转AI新“声”态的更多相关文章
- HMS Core Discovery第13期回顾长文——构建手游中的真实世界
HMS Core Discovery第13期直播<来吧!构建手游中的真实世界>,已于2月24日圆满结束,本期直播我们同三七游戏的专家一同向小伙伴们分享了HMS Core图形引擎服务(Sce ...
- HMS Core Discovery第14期回顾长文|纵享丝滑剪辑,释放视频创作力
HMS Core Discovery第14期直播<纵享丝滑剪辑,释放视频创作力>,已于4月21日圆满结束,本期直播我们同HMS Core视频编辑服务(Video Editor Kit)的产 ...
- HMS Core Discovery第17期回顾|音随我动,秒变音色造型师
HMS Core Discovery第17期直播<音随我动,秒变音色造型师>,已于8月25日圆满结束,本期直播我们邀请了HMS Core音频编辑服务的产品经理.技术专家以及创新娱乐类应用& ...
- HMS Core Discovery第14期直播预告~纵享丝滑剪辑,释放视频创作力
[导读] 拍摄.导入.特效.卡点.BGM-几步简单的操作,我们便可将生活的瞬间用视频记录与分享.应用前沿AI技术,提供一站式视频处理能力,帮助开发者们构建更智能.更易用.更专业的视频剪辑软件,打造视频 ...
- HMS Core Discovery第17期直播预告|音随我动,秒变音色造型师
[导读] 随着音视频内容品类的不断丰富及音乐创作门槛不断降低,大量用户正热切的参与到全民创作的大潮中.我们应该怎么去拥抱移动端影音潜力市场?音频编辑又可以有什么新玩法? 本期直播<音随我动,秒变 ...
- HMS Core Insights第八期直播预告--创新能力解读
[导读] 在上个月举办的HDC2021华为开发者大会上,全新登场的HMS Core 6向大家展示了包括媒体.图形.连接与通信等领域的众多全新开放能力.如仅用一部RGB摄像头的手机即可完成的3D建模,在 ...
- HMS Core 机器学习服务打造同传翻译新“声”态,AI让国际交流更顺畅
2022年6月,HMS Core机器学习服务面向开发者提供一项全新的开放能力--同声传译,通过AI语音技术减少资源成本,加强沟通交流,旨在帮助开发者制作丰富多样的同声传译应用. HMS Core同声传 ...
- HMS Core Discovery直播预告 | AI画质增强 ,开启超清视界
[直播入口] B站华为开发者联盟:http://live.bilibili.com/22551651 4K.8K视频屡见不鲜,HD.FHD分辨率成小屏标配,当网络卡顿.视频自动切换到较低画质时,用户最 ...
- HMS Core AR Engine 2D图片/3D物体跟踪技术 助力打造更智能AR交互体验
AR技术已经被广泛应用于营销.教育.游戏.展览等场景.通过2D图像跟踪技术和3D物体跟踪技术,用户只需使用一台手机进行拍摄,即可实现海报.卡牌等平面物体以及文物.手办等立体物体的AR效果.尽管近年来2 ...
随机推荐
- python二分法、牛顿法求根
二分法求根 思路:对于一个连续函数,左值f(a)*右值f(b)如果<0,那么在这个区间内[a,b]必存在一个c使得f(c)=0 那么思路便是取中间点,分成两段区间,然后对这两段区间分别再比较,跳 ...
- 云厂商 RDS MySQL 怎么选
1. 摘要 为了让大家更好的了解各云厂商在RDS MySQL数据库功能上的差异,也为给准备上云的同学做个参考,本文将对阿里云.腾讯云.华为云和AWS 的 RDS MySQL数据库进行对比说明. 从一个 ...
- layui数据表格搜索
简单介绍 我是通过Servlet传递json给layui数据表格模块,实现遍历操作的,不过数据量大的话还是需要搜索功能的.这是我参考网上大佬代码写出的搜索功能. 实现原理 要实现搜索功能,肯定需要链接 ...
- python之三元表达式与生成式与匿名与内置函数(部分)
目录 三元表达式 各种生成式 列表生成式(可同样作用于集合) 字典生成式 匿名函数 重要内置函数 map() zip() filter() reduce() 常见内置函数(部分) 三元表达式 三元表达 ...
- 【Azure 存储服务】Java Azure Storage SDK V12使用Endpoint连接Blob Service遇见 The Azure Storage endpoint url is malformed
问题描述 使用Azure Storage Account的共享访问签名(Share Access Signature) 生成的终结点,连接时遇见 The Azure Storage endpoint ...
- SpringCloudAlibaba分布式流量控制组件Sentinel实战与源码分析(上)
概述 定义 Sentinel官网地址 https://sentinelguard.io/zh-cn/index.html 最新版本v1.8.4 Sentinel官网文档地址 https://senti ...
- 五分钟搞懂POM设计模式
转载请注明出处️ 作者:IT小学生蔡坨坨 原文链接:五分钟搞懂POM设计模式 大家好,我是IT小学生蔡坨坨. 今天,我们来聊聊Web UI自动化测试中的POM设计模式. 为什么要用POM设计模式 前期 ...
- LVS+keepalived简单搭建(二)
在LVS1的基础上进行搭建 https://www.cnblogs.com/hikoukay/p/12860476.html keeplived主机 用node01,node04两台 先清掉原先nod ...
- JS:String
String数据类型:字符串 字符串是存储字符的变量. 字符串可以是引号中(可以使用单引号或双引号)的任意文本. var a = "abc"; var b = "123& ...
- 一文理解OpenStack网络
摘要:如果你能理解OpenStack的网络,那么对于其他云平台的网络,应该也可以通过分析后理解掌握了. 本文分享自华为云社区<<跟唐老师学习云网络> - OpenStack网络实现& ...