而不是从一开始就直接选择同归于尽文字转WAV音频