评估前三名的分值文字转WAV音频