我们的策略应该更加保守文字转WAV音频