坐到一比一的模型里完成拍摄文字转WAV音频