也就是通过任务文字转WAV音频