甚至在某种程度上能够比拟当初的文字转WAV音频