所以他们首先开始整顿内部文字转WAV音频