具体详谈他也只给了各方一个大框架文字转WAV音频