有些镜头可能需要贝瑟尼亲自完成文字转WAV音频