而穆根获得的是文字转WAV音频