实际上已经等于是输了文字转WAV音频