似乎在判断这话的可信文字转WAV音频