显然是在做对照分析了文字转WAV音频