所以他必须要多方尝试文字转WAV音频