才将注意力放在了声音的内容上矢量图片生成

才将注意力放在了声音的内容上