因为他已经留下了话语文字转WAV音频