仍然能够听到他们谈论的话语声文字转WAV音频