我们两个人要一块承担文字转WAV音频