一开始在镜头前表演文字转WAV音频