每一次开启都要耗费大量的人力物力文字转WAV音频