而是在找出珍妮相关的所有戏份的同时文字转WAV音频