那么其他人也就因为什么原因而有意避免聚集文字转WAV音频