我们应该特殊对待文字转WAV音频