作者:杨晓楠,周瑾洁,罗森林等BFS 北京森林工作室
算法简介
IBA-Codec 是一种新型的端到端语音编解码器,设计应用了一个集成多注意力网络和 LSTM 网络的intra-inter broad transformer,使其能够捕获具有直接上下文感知的语音帧内和帧间之间的依赖关系,从而提高了重建音频的质量。 此外,还提出应用了一种用于通道建模的dual-branch conformer,能够高度关注重要的语言信息同时去除冗余,以实现高效的音频压缩。 下面的音频样本展示了IBACodec在不同比特率下的编码效果。
音频展示
效果图

多比特率效果
Reference |
||||
IBA-Codec (3.15kbps) |
||||
IBA-Codec (6.3kbps) |
||||
Lyra (3kbps) |
||||
Lyra (6kbps) |
||||
EVS (5.9kbps) |
||||
EVS (9.6kbps) |
||||
OPUS (6kbps) |
||||
OPUS (9kbps) |
原创文章,作者:BFS,如若转载,请注明出处:https://www.isclab.org.cn/2023/04/17/iba-codec-samples/