确定我们现在的位置应该是对方首先要做的文字转WAV音频