双方的任务是完全相反的文字转WAV音频