而这些人只不过是第三阶段里面普通的一群人文字转WAV音频