最后相对低矮的部分文字转WAV音频