而是看他们各自身后的背景文字转WAV音频