为了平滑地处理这条不可消除的延迟边界,我们为 streaming 窗口调了三个参数(它们的默认值在 Higgs streaming scheduler 上, vocoder_scheduler.py#L43-L61): Stride(75 帧): 累积大约 3 秒的 delayed code,再触发一次 vocoder decode step。
Contribute to EsmailLeath/Alemdar development by creating an account on GitHub.