对于镜头的要求文字转WAV音频