结果没有捉到人文字转WAV音频