实在是拍完后他还没总结明白文字转WAV音频