他也能够猜到刚才发生了什么文字转WAV音频