关键在于能否整理记忆文字转WAV音频