大致预判出对方的境界层次文字转WAV音频