只是局限于世俗界文字转WAV音频