而且还是刚从自己嘴里说出来的文字转WAV音频