华为诺亚方舟4K AAI绘画模型实测 小参数也能出好图

华为这波我吹爆,诺亚方舟实验室出手生成4K图片的AAI绘画模型,参数量直接做到0.6B,比SDXL参数小了四倍还多。

像手机这些算力薄弱的设备,也能生成4K图片。小编实测多种风格,平均出图速度10秒左右,生成的图片审美在线,清晰度也非常高,在人像方面的细节表现也很强,而且以后连ControlNet都不用了。

经过小编的测试,这个模型对语言有很强的理解力。我变身甲方要求AI生成动画风格的松鼠打拳击,左边是红色拳套,右边是蓝色,这么多需求下AI居然都能完美达成。同样一段话,放在Stable Diffusion里,不借助插件是达不到这样效果的。

根据论文内容,团队从多方面优化了模型。首先是构建高质量数据集,包括230万个接近4K分辨率的图像。

为了模型能更好地理解提示词,团队使用图像标题生成器Share Captcha替换以往模型使用的LoRA模型,并且采用弱到强训练的训练方式,在有限资源下对模型进行改进和优化。模型引入了新颖的注意力模块,压缩了键和值,提高处理超高分辨率图像时的效率。

咱就是说,啥时候能预装到华为手机上呢?
普通玩家想在手机上玩AI绘画,其实不用追求动辄上G的大模型,小参数的轻量化模型照样能出好看的图,今天就给大家唠唠手机跑AI绘画的几个实用技巧。

首先选模型的时候,别盲目看参数量,不是参数越大出图效果就越好。很多专为移动端优化的小模型,参数量可能只有大模型的几分之一,对语言提示的理解反而更精准,出图速度也快很多,平时随手玩一玩完全够用。

其次是准备提示词的时候,不用堆砌一堆修饰词,把你想要的核心元素说清楚就行,比如想要什么风格、哪个主体、主体的特征分点说清楚,语序别太乱,小模型也能读懂你的需求。我平时想要生成点壁纸,都是直接把想要的场景说清楚,几十秒就能出图,挑挑拣拣总能有满意的。

很多人担心手机算力不够跑不动4K图,其实现在不少模型都做了注意力模块优化,压缩了不必要的运算量,哪怕是千元机,跑个1080P甚至4K图都没问题,只是出图速度会慢个几秒,完全能接受。

要是你对出图构图有要求,也不用非得装ControlNet这类插件,现在不少新训练的轻量化模型,本身对语言的理解能力就很强,你直接把构图要求写进提示词里就行,比如要求主体在左侧,背景是什么颜色,模型基本都能满足,省了装插件的麻烦,对手机用户太友好了。

最后提醒大家,玩AI绘画不用追新追大,适合自己设备的才最好,平时想摸鱼玩一玩,找个优化好的小模型,比抱着大模型卡半天出不了图舒服多了。
华为,AAI绘画模型,诺亚方舟实验室,4K图片生成,AI绘画,SDXL,Stable Diffusion,AI出图,小参数量模型,手机AI绘画
[Q]:华为这款AAI绘画模型参数量是多少?
[A]:华为诺亚方舟实验室推出的这款生成4K图片的AAI绘画模型,参数量为0.6B,比SDXL参数量小四倍多。
[Q]:小参数量模型能在手机上生成4K图片吗?
[A]:这款模型参数量小,对算力要求更低,手机这类算力薄弱的设备也可以直接生成4K图片。
[Q]:这款AAI绘画模型的平均出图速度是多少?
[A]:实测多种风格生成,这款模型平均出图速度在10秒左右。
[Q]:使用这款模型需要搭配ControlNet吗?
[A]:这款模型自身优化到位,不需要搭配ControlNet使用。
[Q]:这款模型对提示语的理解能力怎么样?
[A]:经过实测,这款模型对语言的理解能力很强,复杂的多要求提示词也能准确完成生成。
[Q]:这个模型构建的数据集包含多少图像?
[A]:团队构建的高质量数据集包含230万个接近4K分辨率的图像。
[Q]:这款模型用什么替换了传统的LoRA模型?
[A]:为了提升模型对提示词的理解能力,团队使用图像标题生成器Share Captcha替换了以往模型使用的LoRA模型。
[Q]:这款模型怎么处理超高分辨率图像?
[A]:模型引入了新颖的注意力模块,压缩了运算的键和值,有效提高了处理超高分辨率图像时的效率。
share