而是选择了在人群中不断跳跃文字转WAV音频