这个镜头以后肯定要反复重看文字转WAV音频