各自选取了一个靠近入口的位置文字转WAV音频