而是应该引导他自己去思考文字转WAV音频