首先得到的记忆十分凌乱和残缺文字转WAV音频