他们仍旧需要摄取大量的能源文字转WAV音频