因为他需要一点时间来查看刚刚的变故文字转WAV音频