他只能臆想一下文字转WAV音频