他们就马上会面临着分离文字转WAV音频