主要依靠两点文字转WAV音频