等到吸收足够文字转WAV音频