实际上的拍摄却不是如此文字转WAV音频