而且是在大致相同的时间段文字转WAV音频