相当于在寻常皇朝那吸收10秒钟的量文字转WAV音频