rte-rtc
RTE大会(原“RTC大会”)创立于2015年,是亚太首个、迄今为止规模最大的实时互联网技术盛会,覆盖200+行业场景、累计影响200w+开发者。2020 年,实时互联网大会名称从「RTC 大会」升级为「RTE 大会」,大会主题也从技术布道逐步升级为技术内核、聚焦场景的行业峰会。
今年,RTE2023 将以“智能·高清”为主题,推出辐射实时互联网全生态的论坛及周边活动共计20余场,包括技术开发、趋势洞见、行业观察、创业投资等多维度内容分享,覆盖AIGC、出海、数字化转型等时下最热门的话题讨论。
- 赵斌声网创始人兼CEO
- 钟声声网首席科学家、CTO
- Justine Coulson康嘉婷博士联合国人口基金(UNFPA)驻华代表兼联合国人口基金驻蒙古国主任
- 包研LiveVideoStack联合创始人、 RTE开发者社区Master
- 刘硕中国信息通信研究院云计算与大数据研究所内容科技部副主任、 RTE开发者社区Master
- 揭光发腾讯智能创作与内容平台部技术专家、 RTE开发者社区Master
- 马思伟北京大学博雅特聘教授、计算机学院党委副书记、 RTE开发者社区Master
- 谢磊西北工业大学教授&博导、音频语音与语言处理实验室负责人、 RTE开发者社区Master
- 伍双悟墨科技创始人、RTE开发者社区Master
- 何挺声网副总裁、数字化转型业务负责人
- 李星冶商汤科技商务总监 数字文娱事业部副总裁 李星冶
- 卢恒喜马拉雅首席科学家
- 陈飞Starscape主策划,《萌宠宠之战》产品负责人
- 李斯特声网泛娱乐产品负责人
- 陈景东西北工业大学教授
- 相非蔚来汽车声学资深专家&高级总监
- 吴渤声网音频算法专家
- 朱鹏程网易伏羲语音算法专家
- 范晓鹏哈尔滨工业大学智能接口与人机交互研究中心主任
- 戴伟声网视频编解码负责人
- 王晶华为媒体编解码技术实验室主任
- 高欣玮腾讯微信多媒体团队高级研究员
- 王佳旺Electron 成员,Electron Forge 维护者
- 宜博宜创AI创始人&CEO
- 吴承霖深度赋智创始人&CEO
- 侯云忆声网IoT行业负责人
- 钱奋声网教育行业负责人
- 秦曾昌童程童美首席人工智能教育专家
- 江敏喜马拉雅喜播教育副总经理
- 顾申华Unity中国技术总监
- 刘翔声网数字化产品负责人
- 卢志航华为云媒体服务资深产品经理
- 吕城栋蛙声科技研发总监
- 徐迈北京航空航天大学教授
- 陈雨果声网资深客户端研发工程师
- 顾申华Unity中国技术总监
- 杨剑Rokid AR软件研发负责人
- 七七DatAI产品经理社区主理人
- 薛宇飞智谱 AI 大模型事业部副总裁,CodeGeeX 产品负责人
- 丁凯华为云媒体网络服务架构师
- 刘畅声网分布式存储架构师
- 张武锋海马云RTC团队负责人
- 宋利上海交通大学教授&图像所副所长
- 李忻玮声网AIGC算法工程师
- 刘坤科大讯飞 AI工程院副院长
- 邢孝慈商汤科技首席架构师
- 凌天格格子互动创始人
- 辛童白鲸出海 泛娱乐主笔
- 李进科低速无人驾驶产业联盟秘书长
- 赵贵斌环信CEO
- 徐正礼环信CTO
- 王璨环信即时通讯产品总监
- 栗伟百度智能云泛科技行业解决方案总监
- 程旭文环信政企事业部总经理
- 唐欢环信市场VP
智能化趋势正加快脚步走来。过去一年,AI智能技术为实时互动带来诸多赋能与变革,助力实时互动体验进入全新的高清时代。本届大会主论坛,来自AI与实时互动领域的多位资深大咖将从不同维度解读智能化背景下,2023年实时互动行业大事件、产业发展与技术趋势前瞻。
9:00-9:40 智能·高清 引领实时互动体验新时代(拟) 声网创始人兼CEO 赵斌
9:40-10:10 AI技术在RTE领域的创新与实践(拟) 神秘嘉宾
10:10-10:50 实时互动的智能化趋势(拟) 声网首席科学家、CTO 钟声
10:50-11:10 实时互动助力全球可持续发展(拟) 联合国人口基金(UNFPA)驻华代表兼联合国人口基金驻蒙古国主任 Justine Coulson康嘉婷博士
11:10-12:00 圆桌:AI 如何赋能实时互动体验改善及场景升级? 喜马拉雅首席科学家 卢恒/商汤科技商务总监 数字文娱事业部副总裁 李星冶
更多嘉宾加入中......
随着移动通信、大数据、云计算、人工智能等互联网技术的发展与通信媒介的迭代更新,泛娱乐社交产品呈现出了更加多元的发展方向。年初AIGC引爆行业,GPT的问世为泛娱乐注入新的活力;另一方面,随着硬件设备的持续迭代和网络基础设施的发展,互联网用户对于FHD及4K高清画质的需求也随之增长,AIGC、高清、出海、泛娱乐,交汇出全新的时代篇章。
14:00-14:30 AI时代的泛娱乐社交产品创新(拟) 声网泛娱乐产品负责人 李斯特
14:30-15:00 生成式AI与大模型(拟) 商汤科技商务总监 数字文娱事业部副总裁 李星冶
15:00-15:30 从看到“玩”,点燃直播互动小宇宙(拟) Starscape主策划 陈飞
15:30-16:00 出海翱翔,打造百万流量直播之王(拟) 神秘嘉宾
16:00-16:40 AI+高清,社交新玩法来袭? 主持人:白鲸出海泛娱乐主笔 辛童 / 嘉宾:声网泛娱乐产品负责人 李斯特 Starscape主策划 陈飞
更多嘉宾加入中......
大数据时代视频有了更多的表现形式,极大丰富了用户体验,创造了全新领域。本次视频技术专场将带来超高清视频、沉浸式视频、短视频等领域的最近技术进展,讨论视频技术赋能广电、安防、教育、影视等产业的现状以及核心应用发展趋势。我们还将探讨新一代视频编码技术的落地探索、面向视频传输的信源信道联合编码架构研究和AI 技术与沉浸式视频编解码的深度融合,展望AIGC & XR 技术推动下的视频新趋势。
14:00-14:35 数据驱动下的压缩视频质量增强 徐迈 北京航空航天大学教授
近年来,随着智能终端的发展以及在线视频等新型多媒体业务的普及,网络中所传输的图像视频数据量呈爆炸式增长的趋势,网络带宽供求矛盾日益尖锐,视频编码是网络带宽供求矛盾的关键技术。然而,高压缩比的视频压缩导致视频质量差,极大降低了视频用户体验。本次报告将介绍徐迈课题组在视频质量增强方面的研究工作,主要包括:(1)基于多帧联合优化的压缩视频质量增强技术;(2)面向盲质量增强的动态高效深度网络模型;(3)感知失焦特性的压缩图像质量增强。
演讲提纲:
1.研究背景
2.多帧联合优化的视频质量增强
3.盲质量增强的高效动态深度网络模型
4.感知失焦特性的压缩图像质量增强
14:35-15:10 信源信道联合编码——从图像到任务 范晓鹏 哈尔滨工业大学智能接口与人机交互研究中心主任
图像视频已占互联网流量的90%,且仍在不断增长。随着视频编码技术进步以及标准迭代,视频压缩效率不断提升。然而经过压缩的视频对于比特错误比较敏感,如何提升无线传输条件下视频抗噪能力,是目前仍然需要解决的问题。本报告将首先回顾传统信源信道联合编码、数模混合视频通信等技术,然后介绍新兴的为视频编码带来较大效率提升的AI技术,包括基于深度学习的视频编码、基于深度学习的多任务编码等,并探讨这些技术应用于信源信道联合编码的新思路和新途径。
15:10-15:45 AV1的优化与落地 戴伟 声网视频编解码负责人
AV1自从定稿以来,就因其高效的压缩效率和友好的专利设计收到了广泛的关注,经过5年的发展,AV1的生态圈不断扩大,目前AV1的编解码已经在各个主流的浏览器中得到了支持,并且各种AV1硬件的编解码产品也都在陆陆续续的发布;而AV1的软编的速度,也从最开始的x264的几百倍优化到几十倍甚至几倍,我们已经看到了AV1能够在各个产品线中落地的可行性。在这次的分享中,我们讲着重介绍一下AV1在RTE领域落地时候的一些经验和成果。
演讲提纲:
1. AV1的现状和前景
2. AV1的硬件编解码通路落地
3. AV1的软件编码落地
4. AV1/AV2的发展展望
15:45-16:20 下一代视频图像编解码技术 王晶 华为媒体编解码技术实验室主任
传统编解码算法经过三十年的发展,压缩效果的提升逐渐变得困难。近年来,随着AI的发展,基于AI的视频图像编码技术逐渐得到业界关注。本次演讲将介绍目前业界第一个AI图像编码国际标准JPEG AI,包括模型结构、亮点技术、压缩效果、应用场景等;还将介绍业界领先的AI视频压缩算法AlphaVC,它将与业界算法融合成为AVS探索平台。最后,将对下一代编解码算法进行展望。
演讲提纲:
1. JPEG AI
1.1 High Profile 与Base profile的结构与性能
1.2 轻量化技术点
1.3 芯片功耗与算力分析
1.4 典型应用场景
2. AlphaVC
2.1 模型框架
2.2 运动估计模块
2.3 熵估计模块
2.4 残差编码重建模块
2.5 AVS探索平台介绍
3. 下一代视频编码展望
16:20-16:55 微信基于内容感知自适应的实时视频通话技术 高欣玮 腾讯微信多媒体团队高级研究员
视频通话的服务方案是针对通信网络和通话设备制定策略,往往缺少对于采集视频本身的内容场景的兼顾,微信多媒体团队基于微信视频通话产品的特点,自主创新研发了微信基于内容感知自适应的实时视频通话技术,突破现有视频编解码标准在不同内容场景下的固定分辨率帧率码率等参数的限制,并结合业务场景与团队多年积累的视频编解码技术,设计了实时视频通话基于内容感知的引擎和混合分辨率视频编解码内核。在微信视频通话中落地应用,提升微信用户的视频体验。
演讲提纲:
1. 介绍微信实时通话业务
2. 支撑微信实时通话的WAVE引擎
3. 微信基于内容感知自适应的实时视频通话技术
4. 实时通话业务一些心得体会以及技术展望
本专场将聚焦音频与语音前沿算法的发展,探讨相关技术在实时互动众多场景的落地实践,包括音频 AI 算法与传统算法的融合,前沿音频技术在会议、车载、游戏、硬件终端、AIGC方面的最新应用。从多种场景视角出发,分享音频技术的落地经验,以及为用户带来的体验提升。
14:00-14:35 极端环境中的语音信号获取与传输 陈景东 西北工业大学教授
声信号获取与处理技术不仅是语音通信和人机语音交互系统的基石,也可以用于灾害(如地震、矿难、火灾等)等极端环境中协助完成很多挑战性的任务。但和日常的语音通信和人机交互环境相比,极端场景下的声信号获取与传输面临很多不同的挑战,不仅涉及到弱信号(信噪比远远小于0分贝)的感知、还涉及到平台的设计与平台噪声控制等诸多问题。在这个报告中,我将简要介绍麦克风阵列的设计与处理方法,然后讨论如何利用麦克风阵列来实现灾难场景下微弱声信号的获取、参数估计以及信号和参数的传输问题。
14:35-15:10 汽车音频新风口下的机遇和挑战 相非 蔚来汽车资深专家&技术总监
15:10-15:45 音频AIGC在喜马拉雅的研发以及落地 卢恒 喜马拉雅首席科学家
随着神经网络以及大模型技术的兴起,多模态以及语音大模型技术也成为了研究热点。本次分享主要介绍喜马拉雅语音大模型技术,包括语音生成以及风格转换的大模型的研究以及落地。同同时介绍多模态情感识别大模型在语音交互中的应用。
演讲提纲:
1. 语音生成大模型
2. 多模态情感识别
3. 音频AIGC在喜马拉雅的落地应用
15:45-16:20 声网凤鸣AI引擎:AI音频降噪、AI回声消除和3D空间音频算法的实现与应用 吴渤 声网音频算法专家
声网凤鸣AI引擎包含了AI降噪、AI回声消除、空间音频等在内的声网新一代智能音频技术。其中凤鸣·AI降噪采用均衡的损失函数组合方案来兼顾强降噪与高保真,采用噪声抑制和远场去混响一体化模型在强降噪的同时实现远场混响抑制;凤鸣·AI回声消除采用均衡的损失函数组合方案来兼顾非线性回声抑制和近端语音保护,实现高保真音频体验;凤鸣·空间音频通过纯软件算法方案,模拟头部球面区域立体声场,利用范围音频、人声模糊、空气衰减模拟等能力,模拟现实听觉感受。
演讲提纲:
1. 凤鸣AI引擎在解决音频领域多个核心问题上的价值
2. 基于传统信号处理的音频算法在实际应用中的问题
3. 基于人工智能的音频降噪算法的研究与应用
4. 基于人工智能的回声消除算法的研究与应用
5. 基于3D空间音频技术的研究与应用
6. 总结与展望
16:20-16:55 游戏场景下的音频内容生成式技术 朱鹏程 网易伏羲语音算法专家
随着深度学习技术的发展,语音技术逐渐在生活的各个应用场景落地生根。在本次报告中,将结合游戏场景下,音频内容生成的需求与实际问题,分享网易伏羲在生成式音频技术上的经验与成果。同时,对未来游戏场景下,音频内容生成式技术的趋势进行展望。
演讲提纲:
1. 游戏剧情音频内容生成
2. 游戏实时语音生成玩法
3. 实时语音转换技术
4. 游戏场景下,音频技术尚未解决的需求
16:55-17:30 蛙声在音视频硬件领域的技术实践 吕城栋 蛙声科技研发总监
音频类的产品是一项系统性工程,从硬件的器件选型、腔体结构设计、芯片、功耗等等,各个方面都影响着整体产品的表现。本次报告,将会结合蛙声在音视频硬件研发过程中的积淀,聚焦远程和本地会议协作场景,针对客户实际使用场景中的各种痛难点需求,分享蛙声在音频硬件研发过程中的实践经验,相关的软硬件技术,以及对未来行业应用前景的展望。
演讲摘要:
1. 音频类产品在不同用户场景下的痛点和需求
2. 音频类产品研发的硬件选型策略
3. 音频类产品前端音频信号实时处理技术
4. 行业应用与未来展望
三年来,超音速计划见证着新场景新技术的萌芽与成长,尤其在 AI 的加持下,创业者正在向更细分的场景探索 RTE 的潜力。AIGC、心理疗愈、低代码......越来越多的场景都在强调沉浸感与互动性。今年,这些令人惊叹的新技术、新场景以及新应用都将亮相第三届RTE创新大赛决赛!超音速计划年度八强以及海外RTE优胜者将现场角逐全球四强!
14:00-14:20 开场致辞与规则介绍
14:20-16:00 2023年超音速计划年度八强路演
16:00-16:50 2023年海外startup battlefield获胜团队路演
16:50-17:45 创投圆桌
17:45-18:30 RTE创新大赛年度三强颁奖典礼



























rte-rtc的更多相关文章
- 有奖征文活动:从 RTC 到 RTE,从音视频到「实时万象」!
Hi 小伙伴们, 社区已经更名 RTE 两个月辣-大家对于 RTC 和 RTE 的区分,是否还有疑惑呢? 关于这两者的区别,我们创始人兼 CEO 赵斌老师说: "RTC(实时音视频)从 Co ...
- 声网王浩宇:RTE 场景下的 Serverless 架构挑战【RTE 2022】
前言 在「RTE2022 实时互联网大会」中,声网云原生边缘计算团队的负责人 @王浩宇 Dylan 以<RTE 场景下的 Serverless 架构挑战 -- 声网如何兼顾后端服务的可靠.高效和 ...
- 声网赵斌:RTE 体验提升,新一代 Killer App 将成为现实丨RTE 2022
一年以来,在疫情及诸多综合因素的推动下,元宇宙.无人驾驶. IoT.电商直播等行业迎来井喷式发展,RTE 实时互动技术也在越来越多的场景中发挥着关键作用.在刚刚过去的 RTE 2022 第八届实时互联 ...
- 后疫情时代,RTE“沉浸式”体验还能这么玩?丨RTE 2022 编程挑战赛赛后专访
前言 9 月 17 日,由声网.环信与 RTE 开发者社区联合主办的"RTE 2022 编程挑战赛"圆满落幕.从 300+ 支参赛队伍中冲出重围的 27 支决赛队伍,在元宇宙中用精 ...
- 灵感宝盒新增「线上云展会」产品,「直播观赏联动」等你共建丨RTE NG-Lab 双周报
前言 哈喽各位开发者,「RTE NG-Lab 双周报」如期而至! 近两周,我们更新了一些新的实时互动场景和产品,也举办了代码实验室的第一次线下活动,与大家一起体验了声网最新的 4.0 SDK. 灵感宝 ...
- FastCorrect:语音识别快速纠错模型丨RTC Dev Meetup
前言 「语音处理」是实时互动领域中非常重要的一个场景,在声网发起的「RTC Dev Meetup丨语音处理在实时互动领域的技术实践和应用」活动中,来自百度.寰宇科技和依图的技术专家,围绕该话题进行了相 ...
- 依图在实时音视频中语音处理的挑战丨RTC Dev Meetup
前言 「语音处理」是实时互动领域中非常重要的一个场景,在声网发起的「RTC Dev Meetup丨语音处理在实时互动领域的技术实践和应用」 活动中,来自百度.寰宇科技和依图的技术专家,围绕该话题进行了 ...
- 马志强:语音识别技术研究进展和应用落地分享丨RTC Dev Meetup
本文内容源自「RTC Dev Meetup 丨语音处理在实时互动领域的技术实践和应用]的演讲分享,分享讲师为寰语科技语音识别研究主管马志强. 01 语音识别技术现状 1.语音成为万物互联时代人机交互关 ...
- 开源不易、安全慎行,中国软件如何走向文明?丨RTE 技术环境月报 202205
各位开发者小伙伴: 这里是 2022 年第 5 期的 RTE<技术环境月报>--致力于成为对大家"有用"的 Highlight 看板--每月初通过 RTC 开发者社区( ...
- 当基础设施故障后,声网 SD-RTN™ 如何保障 RTE 服务的高可用性
云计算的出现为企业的管理.业务开展.资源整合等带来了极大的便利性,也是数字化建设的核心基建之一,然而局部宕机或者大面积宕机事件对于云厂商来说却也无法避免,全球领先的计算平台也不例外.例如,美国东部时间 ...
随机推荐
- HTML5新特性之Web Storage
Web Storage是HTML5新增的特性,能够在本地浏览器存储数据,对数据的操作很方便,最大能够存储5M. Web Storage有两种类型: SessionStorage 和 LocalStor ...
- 【了解LLM】——LoRA
本文地址:https://www.cnblogs.com/wanger-sjtu/p/17470327.html 论文链接:link code: github 什么是LoRA LoRA,英文全称Low ...
- 记一次 .NET 某企业采购平台 崩溃分析
一:背景 1. 讲故事 前段时间有个朋友找到我,说他们的程序有偶发崩溃的情况,让我帮忙看下怎么回事,针对这种 crash 的程序,用 AEDebug 的方式抓取一个便知,有了 dump 之后接下来就可 ...
- 跑得更快!华为云GaussDB以出色的性能守护“ERP的心脏”
摘要:GaussDB已经全面支撑起MetaERP,在包括库存服务在内的9大核心模块中稳定运行,端到端业务效率得到10倍提升. 本文分享自华为云社区<跑得更快!华为云GaussDB以出色的性能守护 ...
- 记一次 .NET 某游戏服务后端 内存暴涨分析
一:背景 1. 讲故事 前几天有位朋友找到我,说他们公司的后端服务内存暴涨,而且CPU的一个核也被打满,让我帮忙看下怎么回事,一般来说内存暴涨的问题都比较好解决,就让朋友抓一个 dump 丢过来,接下 ...
- Oracle随机生成大数据
Oracle随机插入大数据 话不多说,安排 示例: -- 创建新表并批量插入五千万数据 create table TEST_TAB as select rownum as id, to_char(sy ...
- 学好Linux的必经之路
学好Linux的必经之路 学习动机的培养对于一个人学习习惯的形成有着重要的作用.当我们在学习某一个事物时,建立属于我们自己的学习方法,以此培养我们学习Linux系统的学习动机. 当前,Linux系统属 ...
- C++ 核心指南之 C++ P.哲学/基本理念(上)
C++ 核心指南(C++ Core Guidelines)是由 Bjarne Stroustrup.Herb Sutter 等顶尖 C+ 专家创建的一份 C++ 指南.规则及最佳实践.旨在帮助大家正确 ...
- 数据分析师如何用SQL解决业务问题?
本文来自问答. 提问:数据分析人员需要掌握sql到什么程度? 请问做一名数据分析人员,在sql方面需要掌握到什么程度呢?会增删改查就可以了吗?还是说关于开发的内容也要会?不同阶段会有不同的要求吗? 正 ...
- 明白error类型让你更快定位开发报错
在javascript中,开发遇到的项目报错,很多时候都是通过 Error 这个类来展示的,清楚Error的类型可以更好定位项目中的问题 Error的类型 Error Error是所有其它错误的父类, ...