却是从一开始就判定了文字转WAV音频