因为他们在脚步声中听出文字转WAV音频