所以他也就忽略了这些人之前的表现文字转WAV音频