因为他们还要执行自己的任务文字转WAV音频