这个人应该是介于外围和核心之间文字转WAV音频