但是需要让他们自身的去承受文字转WAV音频