并没有受到那些人脸的干扰文字转WAV音频