里面装着的只是一个仿真模型文字转WAV音频