只能是内部当中有数的几个人文字转WAV音频