更多依靠的是鼻子……文字转WAV音频