却要将几十种甚至数百种原料混合在一起文字转WAV音频