
4月1日,阿里巴巴发布图象天生与编纂同一模子Wan2.7-Image。直击当前 AI 生图范畴“尺度脸”审美疲惫及“色采盲盒”等痛点,该模子可实现“千人千面”,捏出“活人感”,全新的“调色盘”功效可精准节制色采。 Wan2.7-Image具有文生图、图生组图、图象指令编纂及交互式编纂等全链路能力。于人类偏好盲测中,“文生图”能力跨越GPT-Image1.5及海内主流模子,于文本衬着、照片级成像及世界常识指标上,靠近Nano Banana Pro。 图说:Wan2.7-Image的人类偏好盲测评分位各国内第一。 为离别陈旧见解的“AI脸”,Wan2.7-Image强化了虚拟形象捏脸功效,撑持从骨相、眼眸到五官细微处的全方位定制,好比改换提醒词中的脸型(鹅蛋脸、圆脸、方脸、长方脸等)、眼部特性(杏仁眼、艰深眼窝、圆眼、丹凤眼等),实现“千人千面”。 艺术家及设计师需精准节制颜色,贸易海报对于配色还有有严酷要求,但AI生图往往是“色采盲盒”。Wan2.7-Image全新撑持“调色盘”功效,用户可经由过程HexCode,一键提取或者输入参考图的各类颜色及占比,从马蒂斯浓烈的红色系、梵高妖冶的黄色系,到毕加索清凉的蓝色系,都能参考天生同色系的图片,并可自由调控颜色的数目及占比,自界说配色方案。 超长文字衬着是AI生图的痛点,轻易文字恍惚、内容庞杂甚至直接漏写。依附长上下文文本编码(Long Context Text Encoder)解析超长序列,Wan2.7-Image对于超长文字、表格及繁杂公式的衬着可达印刷级,撑持12种语言,最高3K tokens的超长文字输入,可输出一页A4纸的论文。 此外,Wan2.7-Image还有具有强盛的组图天生能力,可天生多达12张,用在批量建造同气势派头系列图、PPT配图、分镜剧本、电商模特套图和多视角修建图。 假如说生图能力是创作的基石,那末编纂功效则付与了创作者掌控力。Wan2.7-Image原生撑持交互式编纂模块,更懂创作者的需求——“哪里不爽点哪里”,用户可经由过程精准框,于指定区域元素添加、对于齐、挪动元素或者logo,实现像素级用意对于齐。 Wan2.7-Image的多主体一致性最高撑持输入9张图片作为参考源。对于在合影、影戏海报和家具组合图等,可连结气势派头与特性的同一。其他经常使用的图象编纂能力,如镜头视角节制、光影处置惩罚、材质参考、照片修复、虚拟试衣等数十种实用功效,Wan2.7-Image也能更不变地输出,离别“抽卡”式创作。 不只会生图,还有更懂图,Wan2.7-Image更强的理解能力源在模子架构与练习历程中的技能冲破。 于练习数据上,超年夜范围的异构数据底座不仅涵盖全域品类的视觉素材,还有整合了理解类数据;于模子架构上,模子采用了领先的天生与理解同一模子架构,同享隐空间(Latent Space)来实现语义映照,文字紧挨着画面,模子不需吃力去猜文字对于应的画面;于练习流程中引入多模态指令(好比文字+图片),使患上模子实现了从纯真“像素拟合”到“底层语义认知”的奔腾。 此外,于数据工程维度,按照图象的结构、文字、光影、拍摄角度及用途等,模子团队构建了多维邃密标注系统。共同进步前辈的分阶段练习计谋与多使命优化,模子于长尾场景下仍旧连结了极高的天生稳健度。基在更年夜范围数据和尺寸练习而成的Wan2.7-Image-Pro也同步上线,天生图象的构图越发不变,语义理解更强更精准。 Wan2.7-Image的强盛功效可运用在多个行业。对于在短剧与影视团队,借助千人千面的捏脸体系与分镜天生能力,可低成本完成脚色设定、动作模拟与殊效预览;对于在自媒体与内容创作者,可轻松天生多气势派头封面、OOTD穿搭;于电商范畴,只需单张模特图,便可裂变天生特写图、差别场景的卖点图,年夜幅降低拍摄成本;教诲及科研从业者可直接挪用模子天生论文配图、信息图表与儿童绘本。对于在时下年夜火的“龙虾热”,Wan2.7-Image 现已经撑持skill挪用,让龙虾画画,周全解锁天生模子的运用场景。 本日起,用户可于https://tongyi.aliyun.com/wan/、wan.video网站及阿里云百炼体验Wan2.7-Image,千问App也行将接入。 雷峰网(公家号:雷峰网) 雷峰网版权文章,未经授权禁止转载。详情见转载须知。




