所以并没有脱离原来的路线文字转WAV音频