只是需要让他们在这种无法依靠设备文字转WAV音频