因为他非常清楚自己的定位文字转WAV音频