而且一个牛仔的角色也能够区别于文字转WAV音频