我刚才用灵识分析了一下他们的人文字转WAV音频