并不是凭他的直觉文字转WAV音频