观众在镜头里是看不到两个人下半身的文字转WAV音频