他们甚至因此慢慢停下了训练文字转WAV音频