不能简单的用得失来衡量文字转WAV音频