另外一半就由我们来平均分配了文字转WAV音频