NES 模拟器中音画同步问题
背景
模拟器是与游戏和播放器都有相似之处的系统。模拟器与游戏的相似之处,在于都需要一个采集输入--执行逻辑--然后按一定帧率(通常是 60 FPS)把画面显示出来的循环。但是模拟器又需要模拟音频设备,播放音频设备产生的声音样本,这点与播放器相似。与播放器一样,模拟器也要处理音、视频同步问题,但是模拟器的特别之处又导致它与播放器的音、视频同步问题不太一样,解决方案也不一样。
有什么问题?
考虑下面这个渲染循环,初看之下这个循环做了该做的事,好像是没有问题的。
while (keep_running) {
next_frame_time = time_now() + 16.667;
emu_run_one_frame();
audio_play(emu_get_audio_samples());
video_render(emu_get_video_frame());
sleep_until(next_frame_time);
}
但如果你照着去实现,就会发现存在下列问题。
问题一,噪声
上面的渲染循环对于画面渲染来说可能已经够了,但是对于声音来讲就不够了。人耳是很灵敏的,声音中有一点不连贯都会被人耳察觉。由于 sleep_until
不可能像硬件一样精确,因此可能某一帧 audio_play
送出去的样本就会 “晚点”,一旦样本 “晚点” 声音就会出现不连贯,这时就会听到 “嗞嗞” 声。
为了避免不连贯,通常的做法就是多累积一些声音样本,但这样又会带来第二个问题。
问题二,画面与操作不同步
要累积足够的样本,需要提前缓存足够的帧。虽然音频不出现问题了,但是由于视频帧是提前产生的,所以玩家看到的画面就是过时的,这时玩家再进行操作就太迟了。
这里,我们也可以看到游戏主机模拟器与播放器的不同。游戏主机需要采集玩家的输入,而玩家的输入又与看到的画面有关,因此不能缓存,需要实时。
问题三,音画不同步
除了提前缓存可以避免声音不连贯,将每帧的时间间隔减小也可以避免问题,但这也是一个不可取的方法。
比如将帧间隔时间改为 16 毫秒,则视频帧率为 62.5 FPS,但是音频依然是按原速率播放的,只是噪音没有了而已。这样要不了多久,音频就会明显落后于画面。而且,由于音频样本累积的速度比实际播放速度快,待播放的样本会越来越多,内存的占用量也会慢慢变大!
解法一,修改 APU 实现
声音样本是由模拟的 APU 产生的,观察 APU 的内部结构不难发现,NES 的 APU 可以看作是一个包含 5 个振荡器的 PSG。从 NES 程序的角度看,播放音乐就是在特定的时间顺序对振荡器进行编程,使之产生相应波形。又或者说,播放音乐就是在特定的时间点调用振荡器 API,控制它产生想要的波形。
因此,可以自己实现一些振荡器,把对 APU 的控制翻译成对振荡器的 API 调用:
class APU {
/* ... */
void write_register(uint16_t addr, uint8_t data) {
switch (addr) {
case 0x4002:
_pulse1.set_freq(/* ... */); // 根据计时器值 data 计算出频率
break;
/* ... */
}
}
private:
PulseOscillator _pulse1, _pulse2;
};
不过,以上方案需要注意时机问题。因为模拟器一般是一帧一帧地模拟,一帧中,write_register
会被调用多次。原本的 NES 程序对 APU 的控制是很精细的,到模拟器中就会变得粗糙,只能在一帧中对 APU 进行集中式设置。
要达到原本 NES 程序那样的精细程度,需要做到可以在指定的时间点调用振荡器 API。这个时间点怎么计算呢?我们知道,NES CPU 的时钟频率是 1.789773 MHz,而 APU 的时钟频率是 CPU 的一半,约 894.8865 KHz,可以算出一个 APU 时钟周期是 1117.5 ns。如果 CPU 在 APU 时钟 c
的时候写入了 $4002
寄存器,更改了方波通道 1 的频率,那么这个更改就应该在 t0 + c * 1117.5ns
时刻生效(其中,t0
表示 APU 时钟周期 0 的真实时间)。以下是修改过的版本:
class APU {
/* ... */
void write_register(uint16_t addr, uint8_t data) {
switch (addr) {
case 0x4002:
post_timed_task([](){
_pulse1.set_freq(/* ... */);
}, now());
break;
/* ... */
}
}
private:
unsigned long long now() const {
return _t0 + (unsigned long long)(_elpased_cycle * 1117.5);
}
PulseOscillator _pulse1, _pulse2;
unsigned long long _t0, _elapsed_cycle;
};
这个方案的缺点我认为是比优点多的,它唯一的优点可能就是没有动到渲染循环,而缺点则主要有以下两点。
首先,是需要额外的工作量。APU 的声音通道已经是振荡器了,为了播放声音,还需要再实现一套振荡器,增加了工作量。此外,post_timed_task
还牵涉到实现定时器、任务队列及多线程的一些东西。
其次,不够精确。前面提到,sleep_until
是不精确的,虽然音画是同步的,但是由于 sleep_until
的误差,会导致整个模拟是有误差的。随着时间增加,误差会越来越大,运行一段时间后,就会发现你的模拟器比市面上的流行模拟器慢很多。音乐听起来也可能不对劲,好像降了调一样。
解法二,改进渲染循环
通过前文的介绍,不难发现,问题的主要原因可以归结为 sleep_until
不精确。事实上,如果边产生样本边播放,再精确都不太够。一定得是先缓存一部分样本,然后赶在样本播放完毕前,送入新的样本。因此,只提高 sleep_until
的精度是不够的,还需要让渲染循环有某种自适应的能力,能够自动调整每帧间隔。要做到这点,可以在 sleep_until
结束后再获取一次时间。如果比预定时间早,下一帧时间可以适当延后;如果晚点,就适当提前一点。虽然思路是这个思路,但是实现上有比获取时间更靠谱的方案,就是计算播放了多少个样本。因为在一帧的时间内,模拟器可能没有产生足够的样本。以采样率 44.1 K 为例,一帧的时间内模拟器应该要产生 735 个样本,但实际上模拟器可能只产生 734 个样本。即使时间间隔弄对了,虽然只有一个样本的差别,但还是会听到恼人的噪音。
基于上面的思路,更新后的渲染循环如下:
constexpr auto sample_interval = 1e3/44100.0; // 采样间隔,毫秒
int samples_to_play = 0;
auto t0 = time_now();
auto next_frame_time = t0;
while (keep_running) {
sleep_until(next_frame_time);
auto now = time_now();
auto elapsed_time = now - t0;
auto samples_played = elapsed_time / sample_interval;
t0 = now;
// 结合后面,这里可以让下一帧的时间提前大概 2 个样本的时间(约 44 微秒)
// 这样就能在样本播放完毕之前送入新的样本
samples_to_play -= samples_played + 2;
if (samples_to_play < -490) {
// 延迟过于严重,魔法数 490 可以自由选择,取决怎么认定 “严重”
samples_to_play = 0;
}
emu_run_one_frame();
samples_to_play += emu_get_num_samples();
audio_play(emu_get_samples());
video_render(emu_get_video());
next_frame_time = now + samples_to_play * sample_interval;
}
现在终于有一个堪用的渲染循环了,但是 sleep_until
的误差还是会带来一些问题。如果 sleep_until
的误差太大,导致帧间隔波动明显,画面的不连贯就会被人眼察觉到。sleep_until
最精确的实现方式大概就是如下的忙等,不过也看得出来,这样方式实在不优雅。
void sleep_until(double when) {
while (time_now() < when);
}
最节约 CPU 的方式当然就是直接使用系统的 sleep
,前面谈到,这种方式误差太大。讲到这里,其实一个可行的方案就呼之欲出了 -- 把这两个方案综合一下就能得到一个精度可以接受的 sleep_until
函数了。
void sleep_until(double when) {
// 硬编码的误差值,毫秒
constexpr auto error = 1.5;
auto sleep_time = round(when - time_now() - error);
if (sleep_time > 0) {
sleep(sleep_time);
}
while (time_now() < when);
}
如果是在 Windows 平台,还需要额外使用 timeBeginPeriod
函数才能让 sleep
的误差更加可控。
总结
本文探讨了模拟器中的音画同步问题,分析了各个原因,并提供了相应的解决方案。如果读者朋友正在实现模拟器,遇到了同样的问题,希望能有所启发。本文提到的解法二,对于实现游戏循环也是一个参考。
当然,同样的问题不同的人会给出不同的解法。对于本文提到的问题,欢迎读者朋友在评论区留下您的见解与思考。
NES 模拟器中音画同步问题的更多相关文章
- 在FPS游戏中,玩家对音画同步感知的量化与评估
前言 在游戏测试中,音画同步测试是个难点(所谓游戏音画同步:游戏中,音效与画面的同步程度),现在一般采用人工主观判断的方式测试,但这会带来2个问题: 无法准确量化,针对同一场景的多次测试结果可能会相反 ...
- ffmpeg protocol concat 进行ts流合并视频的时间戳计算及其音画同步方式一点浅析
ffmpeg protocol concat 进行ts流合并视频的时间戳计算及音画同步方式一点浅析 目录 ffmpeg protocol concat 进行ts流合并视频的时间戳计算及音画同步方式一点 ...
- NES模拟器开发-CPU笔记
我的项目XNES已经开始动手编码了,目前的进度大概是cpu的模拟完成了大概10~20%左右.简单记录一下CPU模拟过程中遇到的问题和思考. 原理: cpu模拟实际就是模拟cpu处理opcode的过程, ...
- 准备开发一款开源NES模拟器
前几天无意见看到一些NES的开发资料,勾起了小时候暑假的无数美好回忆,做为一名码农,萌发了自己写一款模拟器的想法.一来可以加深自己对整个系统/游戏的理解,一来可以实现小时候的梦想:),希望可以坚持下来 ...
- NES模拟器开发-PPU笔记
20151008 占坑,暂时没弄清楚PPU数据如何初始化,绘制顺序等.
- arm 2440 linux 应用程序 nes 红白机模拟器 第1篇
对比了很多种,开源的 NES 模拟器 VirtuaNES , nestopia , FakeNES , FCEUX , InfoNES , LiteNES 最后决定使用 LiteNES 进行移值,它是 ...
- nes 红白机模拟器 第1篇
对比了很多种,开源的 NES 模拟器 VirtuaNES , nestopia , FakeNES , FCEUX , InfoNES , LiteNES 最后决定使用 LiteNES 进行移值,它是 ...
- QQ视频直播架构及原理 流畅与低延迟之间做平衡 音画如何做同步?
QQ视频直播架构及原理 - tianyu的专栏 - CSDN博客 https://blog.csdn.net/wishfly/article/details/53035342 作者:王宇(腾讯音视频高 ...
- C#搞个跨平台的桌面NES游戏模拟器
支持Windows,Mac,Linux NES模拟器内核源码来自 https://github.com/colinvella/EmuNes 他这边的源码功能很完善了的,支持视频录制,手柄,金 ...
- WebRTC 音视频同步原理与实现
所有的基于网络传输的音视频采集播放系统都会存在音视频同步的问题,作为现代互联网实时音视频通信系统的代表,WebRTC 也不例外.本文将对音视频同步的原理以及 WebRTC 的实现做深入分析. 时间戳 ...
随机推荐
- 一步步开发Windows服务(Windows Service)[转]
基于0起步来创建一个服务,做到简单的记录时间日志功能,其具体招行方法可自行添加. 1.创建服务 2.删除默认服务文件 3.添加自己的服务文件 4.更改启动项目 5. 引用 using System.T ...
- win7安装snmp服务
一.安装SNMP Win7操作系统默认情况下是不安装SNMP服务的,今天讲解一下在Win7操作系统下安装SNMP,具体安装步骤如下: 打开控制面板--卸载程序 WIN7操作系统下安装SNMP的步骤如下 ...
- Unable to tunnel through proxy. Proxy returns "HTTP/1.1 503 Service Unavailable"
背景: 某日,一正常项目迁移到新的服务器 新的服务器,需要使用代理来访问之前能直接访问的接口,加完代理之后,发现无法获取数据了 报错: org.springframework.web.client.R ...
- Cannot add task 'wrapper' as a task with that name already exists.
写gradle项目的运行模板脚本 直接执行gradle clean build会报错 将原本的: task wrapper(type: Wrapper) { gradleVersion = '4.10 ...
- C语言三子棋
话说自从大一学C语言后用C语言的巅峰也就是第十二届蓝桥杯了,后续开发什么的都是用的java,搞开发java这样的面向对象语言确实用着更顺手方便点.不过C语言YYDS,"C生万物"嘛 ...
- SpringMVC:文件上传和下载
文件下载 ResponseEntity用于控制器方法的返回值类型,该控制器方法的返回值就是响应到浏览器的响应报文 使用ResponseEntity实现下载文件的功能 @RequestMapping(& ...
- DataV兼容vue3的方法
发现问题 在使用vue开发大屏时,发现了一个很好用的可视化组件库DataV,不是阿里那个DataV哈,用vue2开发时都一切顺利,直到有一天升级项目到vue3时,发现一堆报错,后面查了下,好像是Dat ...
- 千牛hook 旺旺hook,旺旺发消息call,千牛发消息call,千牛机器人,破解旺旺发消息代码,破解千牛发消息代码,反汇编旺旺发消息,反汇编千牛发消息,旺旺发消息组件,千牛发消息组件
由于工作需要,做了相关的编码,有demo,拿去后,直接按demo写代码即可实现千牛发消息,非常稳定.非反汇编找call,基本不怕千牛升级,原理是基于千牛架构做出来的,除非千牛改架构,已稳定使用2年,未 ...
- P3792 由乃与大母神原型和偶像崇拜
题意 给定长为 \(n\) 的数组 \(a\),支持单点修改,\(q\) 次查询区间 \([l,r]\) 是否可以重排为值域上连续的一段. \(n,q\le5\times10^5,a_i\le2.5\ ...
- Dell存储备份告警:
创建时间 修改日期 对象名称 消息 类型 告警状态 已确认 告警定义 类型 23-3-12 11:59:26 23-3-12 11:59:37 copyMirrorswap 2 CMs Operati ...