分数最大的有两副文字转WAV音频