也很难能够尽数吸收文字转WAV音频