因为我们拿回来的那部分记忆里面文字转WAV音频