原本我们的思路是尽量不伤亡文字转WAV音频