说明自己就是录音中的那个人文字转WAV音频