似乎是为了某种平衡文字转WAV音频