他在这里的功能本就是实现一个平衡文字转WAV音频