所以它们注定对立着文字转WAV音频