或者说是重叠的文字转WAV音频