也就是半成文字转WAV音频