而实际上他也就是这么想的文字转WAV音频