HMS Core Discovery第16期回顾|与虎墩一起,玩转AI新“声”态
HMS Core 在AI领域最新的技术能力有哪些?本期Discovery直播以《与虎墩一起,玩转AI新“声”态》为主题,邀请了HMS Core 机器学习服务产品经理、机器翻译高级专家以及HMS Core的新朋友“虎墩”,为大家展示机器学习的语音语言创新技术,分享机器学习与人工智能的宏观发展趋势。一起回顾一下本期精彩内容!

【精彩回顾】
1、抖音网红IP“虎墩小镖师”强势来袭
2、同声传译新亮相,底层技术大揭秘
3、AI翻译能力升级,语种扩充可播报
【专家观点】

Nicolas,华为2012实验室文本机器翻译高级专家
机器翻译暂时无法替代人类。目前需求不高的翻译需求可以依赖机器但要求较高的翻译需求还需要人工介入,人工可以做到点到面的全方位质量把控,比如说话地道与否、语言通顺与否,还可以贡献数据和知识,提升机器翻译质量。

Hardy,HMS Core ML Kit 资深产品经理
AI是智能机器的广义领域,而机器学习是AI的核心应用之一。它指的是任何能够自行“学习”的计算机应用程序或程序,而无需人类的明确规则。未来机器学习技术将会更注重情感体验,向多模态(语音、文字、视觉)、多技术(VR/AR等)、多平台多系统协同态势的方向发展。
【精彩答疑】
Q1:什么是TTS音色定制?TTS音色定制与虎墩在碰撞一起会有什么新玩法?
A:依托华为的数据积累和成熟算法,TTS音色定制在语音合成技术的加持下,只需要提供少量的干净录音数据,就可以进行模型训练,得到高还原度、高清晰度、高稳定性的专属音库,助于提升产品特色、快速打造个性化的品牌特色。ML Kit的新能力TTS与 IP“虎墩小镖师”正在合作中,TTS通过机器训练还原虎墩的音色,后续将逐步开放虎墩音色给开发者使用,助力开发者应用在各类个性化场景。
Q2:机器学习服务提供的翻译和同声传译能力,如何赋能App打造新“声”态?
A:文本翻译能力解决了用户因语言不通而导致交流不畅的痛点。比如通话场景,经过实时语音识别,可以快速将识别的文字转化为目标语言文字;阅读场景,支持提词翻译器功能,帮助用户快捷看到译文;视频类App集成文本翻译服务后,用户可以流畅体验AI实时字幕功能。通过对语音识别、机器翻译、语音合成三项技术的有机整合,同声传译能力有较低时延、较高准确率的特性,适用于会议、直播、演讲等实时性高的场景,支持应用将音频内容实时输出为目标语言文字,生成双语字幕,同时对目标语言文本进行实时播报,降低理解成本,兼具质量与效率。
Q3:除以上语音语言类能力,机器学习服务有新推出其它创新能力吗?
A:在金融电商领域,机器学习服务还提供了活体检测能力。动作活体检测能力使用人脸关键点定位和人脸追踪等技术,通过指令配合动作的形式可以验证用户是否为真实活体本人操作。在银行、证券和借贷等实名制和安全性要求较高的金融领域,活体检测可作为用户远程注册和密码找回环节中的辅助验证,帮助用户甄别欺诈行为,有效抵御攻击行为,保障业务安全。
Q4:机器学习的宏观技术发展趋势是怎样的?
A:首先,机器学习会更加注重情感体验。机器将具有识别、理解和表达喜怒哀乐的能力,识别用户的需求以及环境信息的变化,理解人的情感意图,做出适当反应;其次,是多模态的发展。深度学习技术正从语音、文字、视觉等单模态向学习多模态智能学习发展。未来甚至可以对嗅觉、味觉、心理学等难以量化的信号进行融合,实现多个模态的联合分析,在更多场景、更多业务上辅助人类工作;再次,是多技术的融合,比如VR/AR以及元宇宙等。相信未来AI还将呈现多平台多系统协同态势,以实现更为广泛的赋能,将通用平台、行业平台和端侧应用的协同组合,以软硬一体的方式实现具体应用的功能定制和扩展。
欢迎登录HMS Core机器学习服务首页了解更多技术细节。
了解更多详情>>
访问华为开发者联盟官网
获取开发指导文档
华为移动服务开源仓库地址:GitHub、Gitee
关注我们,第一时间了解 HMS Core 最新技术资讯~
HMS Core Discovery第16期回顾|与虎墩一起,玩转AI新“声”态的更多相关文章
- HMS Core Discovery第13期回顾长文——构建手游中的真实世界
HMS Core Discovery第13期直播<来吧!构建手游中的真实世界>,已于2月24日圆满结束,本期直播我们同三七游戏的专家一同向小伙伴们分享了HMS Core图形引擎服务(Sce ...
- HMS Core Discovery第14期回顾长文|纵享丝滑剪辑,释放视频创作力
HMS Core Discovery第14期直播<纵享丝滑剪辑,释放视频创作力>,已于4月21日圆满结束,本期直播我们同HMS Core视频编辑服务(Video Editor Kit)的产 ...
- HMS Core Discovery第17期回顾|音随我动,秒变音色造型师
HMS Core Discovery第17期直播<音随我动,秒变音色造型师>,已于8月25日圆满结束,本期直播我们邀请了HMS Core音频编辑服务的产品经理.技术专家以及创新娱乐类应用& ...
- HMS Core Discovery第14期直播预告~纵享丝滑剪辑,释放视频创作力
[导读] 拍摄.导入.特效.卡点.BGM-几步简单的操作,我们便可将生活的瞬间用视频记录与分享.应用前沿AI技术,提供一站式视频处理能力,帮助开发者们构建更智能.更易用.更专业的视频剪辑软件,打造视频 ...
- HMS Core Discovery第17期直播预告|音随我动,秒变音色造型师
[导读] 随着音视频内容品类的不断丰富及音乐创作门槛不断降低,大量用户正热切的参与到全民创作的大潮中.我们应该怎么去拥抱移动端影音潜力市场?音频编辑又可以有什么新玩法? 本期直播<音随我动,秒变 ...
- HMS Core Insights第八期直播预告--创新能力解读
[导读] 在上个月举办的HDC2021华为开发者大会上,全新登场的HMS Core 6向大家展示了包括媒体.图形.连接与通信等领域的众多全新开放能力.如仅用一部RGB摄像头的手机即可完成的3D建模,在 ...
- HMS Core 机器学习服务打造同传翻译新“声”态,AI让国际交流更顺畅
2022年6月,HMS Core机器学习服务面向开发者提供一项全新的开放能力--同声传译,通过AI语音技术减少资源成本,加强沟通交流,旨在帮助开发者制作丰富多样的同声传译应用. HMS Core同声传 ...
- HMS Core Discovery直播预告 | AI画质增强 ,开启超清视界
[直播入口] B站华为开发者联盟:http://live.bilibili.com/22551651 4K.8K视频屡见不鲜,HD.FHD分辨率成小屏标配,当网络卡顿.视频自动切换到较低画质时,用户最 ...
- HMS Core AR Engine 2D图片/3D物体跟踪技术 助力打造更智能AR交互体验
AR技术已经被广泛应用于营销.教育.游戏.展览等场景.通过2D图像跟踪技术和3D物体跟踪技术,用户只需使用一台手机进行拍摄,即可实现海报.卡牌等平面物体以及文物.手办等立体物体的AR效果.尽管近年来2 ...
随机推荐
- 深入C++06:深入掌握OOP最强大的机制
深入掌握OOP最强大的机制 1. 继承的基本意义 类与类之间的关系:①组合:a part of ... 一部分的关系:②继承: a kind of ... 属于同一种的关系: 继承的本质:a. 代码的 ...
- DDoS攻击--Syn_Flood攻击防护详解(TCP)
https://blog.csdn.net/qq_34777600/article/details/81946514
- java并发编程-StampedLock高性能读写锁
目录 一.读写锁 二.悲观读锁 三.乐观读 欢迎关注我的博客,更多精品知识合集 一.读写锁 在我的<java并发编程>上一篇文章中为大家介绍了<ReentrantLock读写锁> ...
- 使用 IDEA 构建聚合工程并引入 Spring Boot
简介 聚合工程里可以分为: Project 项目,也可称为顶级项目.顶级工程.父工程 Module 模块,也可称为子模块.子工程 总结一下: 这两者之间是父子继承的关系,即 模块继承顶级项目,模块之间 ...
- 面试官问:Go 中的参数传递是值传递还是引用传递?
一个程序中,变量分为变量名和变量内容,变量内容的存储一般会被分配到堆和栈上.而在 Go 语言中有两种传递变量的方式值传递和引用传递.其中值传递会直接将变量内容附在变量名上传递,而引用传递会将变量内容的 ...
- 渗透:dSploit
dSploit--开源的专业的Android平台安全管理工具包 只能在横屏模式下工作,即使你旋转你的设备也将继续保持横屏,如果你有一个应用程序,如旋转控制器,迫使每一个应用程序旋转,将导致dSploi ...
- 2020级cpp机考模拟题A卷-#题解2
这部分的题目都有一定难度,有兴趣的同学可以钻研一下. 特此感谢来自BDT20030 tql的支持. 2:素数的和-2 题意: 计算不大于m的素数之和.(多么容易理解的题目啊,对吧) 题解(有点复杂的 ...
- 免申请直接用上 IDEA 新 UI,只需要这三步配置
早上给大家介绍了IDEA官方宣布正在开发一套全新的UI,但目前是预览版需要申请才能体验. 随后马上就有网友分享了,不需要申请直接就能激活体验的方法. 本期视频:https://www.bilibili ...
- 一个全新的Vue拖拽特性实现:“移动”部分
关于拖拽 CabloyJS提供了完备的拖拽特性,可以实现移动和调整尺寸两大类功能,这里对移动的开发进行阐述 关于调整尺寸的开发,请参见:拖拽:调整尺寸 演示 开发步骤 下面以模块test-party为 ...
- LoRa模块无线收发通信技术详解
LoRa是一种LPWAN通信技术,它基于扩频技术而广泛应用于超长距离的无线传输场景中.现在,LoRa主要在全世界433.868.915MHz等自由频带工作.其最大特征是灵敏度高,传输距离长,工作功耗低 ...