所以我根本就无法分辨哪个是整过的文字转WAV音频