想利用上一次观察的经验文字转WAV音频