但是分工还是比较明确的文字转WAV音频