他想必能立刻认出在场之人文字转WAV音频