从刚才那两首的质量来判断文字转WAV音频