其实有一多半还是看守文字转WAV音频