所有的判断都是建立在有足够信息的基础上的文字转WAV音频