三方基本获得了共识文字转WAV音频