就单单是记住人身体上的每一个文字转WAV音频