他是在做一个衡量文字转WAV音频