却无法分辨这些话语是否真实文字转WAV音频