然后从自己口中套出有用的信息文字转WAV音频