7月7日,在2023国际人工智能大会上,阿里云宣告AI绘画创造大模型通义万相敞开定向邀测,该模型可辅佐人类进行图片创造,未来可应用于艺术设计、电商、游戏和文创等应用场景。阿里云智能集团CTO周靖人表明,这是阿里云大模型全面掌握多模态才能的要害一步,该才能将逐渐向行业客户开放。
阿里云宣告AI绘画创造大模型通义万相敞开定向邀测
据介绍,通义万相在语义了解和图片生成上均表现优异,首批上线3大才能:在基础文生图功用中,可根据文字内容生成水彩、扁平插画、二次元、油画、中国画、3D卡通和素描等风格图画;在相似图片生成功用中,用户上传恣意图片后,即可进行创意发散,生成内容、风格相似的AI画作;该模型还在业内率先支撑图画风格搬迁,用户上传原图和风格图,可自动把原图处理为指定的风格图。
通义万相基于阿里研制的组合式生成模型Composer,其可通过对配色、布局、风格等图画设计元素进行拆解和组合,提供高度可控性和极大自由度的图画生成作用,仅需一个模型即可支撑多类图画生成类使命才能,该研究成果已在国际AI顶会ICML 2023上宣布。
阿里云在现场展现了该模型生成图片的作用,当输入“沉浸在全页灰度涂色的迷人国际中,有一只山君在曼陀罗安静的森林中,画面采用线条、笔画”后,系统能迅速生成线条细节丰富的山君图片,假如持续使用风格搬迁功用,还可随意切换图片风格。
在去年的国际人工智能大会上,阿里云“通义”大模型系列首次露脸,在此之后,通义千问、通义听悟等模型和产品相继推出,通义万相的面世意味着阿里云在大模型领域已经具有处理或生成文本、语音和图片等模态的才能。目前,阿里云大模型正逐渐走向千行百业,已有超过30万企业请求测试通义千问,通义听悟累计用户数到达36万。
“多模态是大模型演进的必然途径,我们希望用不同模态的才能服务千行百业,协助企业全面拥抱智能化时代。”周靖人表明。