但现在是两人文字转WAV音频