然后观察着众人的表情文字转WAV音频