而且他能够准确判断出我们乘坐电梯下来文字转WAV音频