说难听点就是相互利用文字转WAV音频