不过前提是他们不开口文字转WAV音频