华为开发者大会2022(HDC)上,HMS Core手语数字人以全新形象亮相,并在直播中完成了长达3个多小时的实时手语翻译,向线上线下超过一千万的观众提供了专业、实时、准确的手语翻译服务,为听障人士提供了无障碍参会体验。面对专业性强且词汇量大的科技大会,HMS Core手语数字人是如何准确且流畅地打出手语的?

【解决三大技术难题,科技词汇信“手”拈来】

直播中的实时手语翻译较传统翻译和文本转手语的翻译更为复杂,主要在于语音识别过程中各类场景声学环境复杂难部署;手语词汇数据量少,尤其是专业领域词汇较为匮乏;同时,手语语言具有独特的语序逻辑,并非按照日常说话顺序逐字翻译,而要对语句进行语序调整,比如“我有许多朋友,其中既有健听人,也有聋人”的手语语序是“我/朋友/多,听人/有,聋1/有”。由于手语视觉语言的独特性,手语表达中表情、动作位置、动作方向、体态变化、动作幅度大小等都是影响手语可懂度的重要因素。

“我有许多朋友,其中既有健听人,也有聋人。”的手语语序是

“我/朋友/多,听人/有,聋1/有。”

为了让手语数字人实现高可懂度的AI手语能力,HMS Core手语服务技术团队整合了“语音、手语”全链路的AI能力,解决了三大技术点:语音识别的准确度、手语翻译的准确度、手语动作的流畅度与节奏感。

首先,为了确保直播中演讲者语音能被精准识别,尤其是大量中英文混合的技术名词,HMS Core手语数字人语音识别功能,采用动态的流式声学建模技术,实现了1秒以内即可出识别结果,同时借助热词等定制手段,专业术语的识别效果也得到了定向优化,这为手语数字人下一步的手语翻译提供了高精准度的文本基础。

在手语翻译准确度方面,HMS Core手语服务专门组织了一个动作优化团队,并在机器翻译、手语转写等算法方面进行了创新:通过机器翻译算法,中文表达可快速转写为手语表达,并自动进行词序调整、词义消歧、表情分析;通过双重迁移学习等方法,让算法理解句子的语义和语境,并准确估计出每个手语词对应的体态、表情及口型,实现手语动作、体态、表情、口型全方位地生动表达,有效提升手语转写的准确率及速度。

此外,手语生成方案融合了大量手语语言学研究成果,通过调整词、词组、句子之间的停顿及速度等,增强节奏感。同时,参考新闻手语主播的手语打法,预训练模型的语句浓缩算法,可将复杂的长句浓缩为简单的短句,并基于语义进行翻译,最终生成流畅且符合听障人士表达习惯的手语动作。

对于在HDC大会上常用的科技词汇“华为”,“鸿蒙”及“人工智能”等,其标准打法已纳入HMS Core手语词汇库。而对于大会上“原子化服务”等较少见的组合型专业词汇,则按字面意思将其拆解成“原子”“化”“服务”三个手语动作,同时生成对应的口型。

“原子化服务”

【产品竞争力跃升,从技术创新到产业应用】

HMS Core手语服务经过一年多的发展和技术迭代,目前已支持2万+中文手语词汇,匹配日常沟通交流、新闻、教育、政务办理等丰富场景。当前手语数字人不仅能流畅地打出手部动作,还有丰富的表情和准确的口动,从微笑、开心到惊讶、疑惑、失望等,多达26种表情,灵动又逼真,做到了“听得准”、“翻得对”、“打得好”,更好地为保障听障者的社会参与提供了助力。

目前,HMS Core手语服务已携手音书、知音、畅听无碍、开普云、棉花糖科技、未来媒体、硅基智能等众多开发者,成功将AI手语翻译能力应用在各行各业,完善了无障碍环境建设。畅听无碍app,通过集成HMS Core手语服务,在应用内实现了AI手语翻译功能,让听障人士随需随用,满足他们在日常生活中沟通交流、学习娱乐的需求,同时还能帮助他们在政府、医疗、金融、法律等专业公共服务领域实现无障碍交流。

HMS Core手语服务的应用将不断助力开发者搭建更好的无障碍传播环境,帮助听障者更好地享受信息化发展成果,为他们带来更多陪伴、更多实时交互以及更深的情感联结。未来,HMS Core手语服务,将持续践行“科技,不让任何一个人掉队”,与广大开发者伙伴一起,助力构建数字生态,让无障碍体验惠及更多人。如需进一步了解,请访问HMS Core手语服务。

了解更多详情>>

访问华为开发者联盟官网

获取开发指导文档

华为移动服务开源仓库地址:GitHubGitee

关注我们,第一时间了解 HMS Core 最新技术资讯~

HDC2022的无障碍参会体验,手语服务是如何做到的?的更多相关文章

  1. Insights直播回顾——手语服务,助力沟通无障碍

    HMS Core Insights第九期直播–手语服务,助力沟通无障碍,已于12月29日圆满结束,本期直播与小伙伴们一同了解了HMS Core手语服务的亮点特性.底层技术以及演进规划,下面我们一起来回 ...

  2. PB级大规模Elasticsearch集群运维与调优实践【>>戳文章免费体验Elasticsearch服务30天】

    [活动]Elasticsearch Service免费体验馆>> Elasticsearch Service自建迁移特惠政策>>Elasticsearch Service新用户 ...

  3. Elasticsearch索引容量管理实践【>>戳文章免费体验Elasticsearch服务30天】

    [活动]Elasticsearch Service免费体验馆>> Elasticsearch Service自建迁移特惠政策>>Elasticsearch Service新用户 ...

  4. 腾讯健康码16亿亮码背后的Elasticsearch系统调优实践【>>戳文章免费体验Elasticsearch服务30天】

    [活动]Elasticsearch Service免费体验馆>>Elasticsearch Service新用户特惠狂欢低至4折>>Elasticsearch Service企 ...

  5. Dapr初体验之服务调用

    初次理解服务调用 在微服务中,有一个难点就是:如果你想使用各个服务组件,你就得知道不同服务的地址和端口,也就是服务发现. 在传统应用我们是怎么做的?就是在web项目里配置上api地址,如下: 在一个w ...

  6. Re:从0开始的微服务架构--(二)快速快速体验微服务架构?--转

    原文地址:https://mp.weixin.qq.com/s/QO1QDQWnjHZp8EvGDrxZvw 这是专题的第二篇文章,看看如何搭建一个简单模式的微服务架构. 记得好久之前看到一个大牛说过 ...

  7. 华为开发者大会HDC2022:HMS Core 持续创新,与开发者共创美好数智生活

    11月4日,华为开发者大会HDC2022在东莞松山湖拉开帷幕.HMS Core在本次大会上带来了包括音频编辑服务的高拟真歌声合成技术.视频编辑服务的智能提取精彩瞬间功能.3D Engine超大规模数字 ...

  8. HMS Core使能AI智慧体验,共建创新应用生态

    5月17日,2022年搜狐科技峰会成功举办,峰会汇聚各界大咖,共同探讨AI 技术的深入应用以及行业数字化的发展趋势.华为终端云服务应用生态BU总裁望岳发表题为<使能AI智慧体验,共建创新应用生态 ...

  9. node服务成长之路

    我们的系统也从第一代平台开始到现在第四代平台更换中,对这四代平台做一个简单的介绍: 第一代平台,主要是集中式,以快速上线为目的:第二代平台主要是分布式改造,缓解各服务压力:第三代平台主要做服务端SOA ...

  10. 依赖注入[6]: .NET Core DI框架[编程体验]

    毫不夸张地说,整个ASP.NET Core框架是建立在一个依赖注入框架之上的,它在应用启动时构建请求处理管道过程中,以及利用该管道处理每个请求过程中使用到的服务对象均来源于DI容器.该DI容器不仅为A ...

随机推荐

  1. 部署Netlify站点博客

    Netlify站点部署静态博客 今天尝试把站点部署在Netlify上,因为部署在GitHub Pages上,国内访问速度太慢了,所以就尝试一下别的站点,部署成功之后发现速度还是不太行,后边继续找找原因 ...

  2. HashMap的哈希函数为何用(n - 1) & hash

    前言 在上一篇 Java 中HashMap详解(含HashTable, ConcurrentHashMap) 中提到在map.put(key, value)的过程中,计算完key的hash值, 是通过 ...

  3. Coprime

    Coprime 前置芝士 莫比乌斯反演 正文 首先,我们来分析题意. 题目中给出 \(n\) 个人,每个人有一个编号 \(k\) ,要求我们从中选出 \(3\) 个人,三人编号分别为 \(k_a\) ...

  4. 静态文件:Static Files

    官方文档地址:https://fastapi.tiangolo.com/zh/tutorial/static-files/ from fastapi import FastAPI from fasta ...

  5. kvm里的虚拟机硬盘和网卡使用virtio驱动

    1.首先从虚拟机的xml文件中找到已经使用virtio驱动的硬件,复制里面的address这行参数出来 <address type='pci' domain='0x0000' bus='0x00 ...

  6. 关联Prometheus与Alertmanager

    在Prometheus的架构中被划分成两个独立的部分.Prometheus负责产生告警,而Alertmanager负责告警产生后的后续处理.因此Alertmanager部署完成后,需要在Prometh ...

  7. 使用Recoding Rules优化性能

    通过PromQL可以实时对Prometheus中采集到的样本数据进行查询,聚合以及其它各种运算操作.而在某些PromQL较为复杂且计算量较大时,直接使用PromQL可能会导致Prometheus响应超 ...

  8. 2. Fluentd事件的生命周期

    事件(Event)是Fluentd内部处理流程使用的数据结构,日志记录一旦进入Fluentd便被封装成一个event.Event由三部分组成:tag.time.record. tag: 标识事件的来源 ...

  9. 2流高手速成记(之三):SpringBoot整合mybatis/mybatis-plus实现数据持久化

    接上回 上一篇我们简单介绍了基于SpringBoot实现简单的Web开发,本节来看Web开发中必不可少的内容--数据持久化 先看项目结构: 1. 创建数据表 打开mysql,打开数据库 test (没 ...

  10. PAT (Basic Level) Practice 1017 A除以B 分数 20

    本题要求计算 A/B,其中 A 是不超过 1000 位的正整数,B 是 1 位正整数.你需要输出商数 Q 和余数 R,使得 A=B×Q+R 成立. 输入格式: 输入在一行中依次给出 A 和 B,中间以 ...