作者 | Kino 懒人
编辑 | 张洁
自从拜读了之前火出圈的《AI圈炒作圣经》后,我们在测评AI产品时,评价已经变得格外谨慎和收敛了。
但GPT Image 2这次确实有点东西,完全配得上那些浮夸的赞美。
目前的行业共识很清晰,GPT Image 2已经超越Nano Banana 2,稳稳坐上了生图模型的SOTA宝座。
多余的溢美之词就不说了,我们直接让GPT image 2自己生成了一张介绍其强大之处的图:
再比如今天下午,我们去参加了小红书聊「适我主义趋势」的活动,发现把官方准备的长达一万字的媒体资料包,直接扔给GPT Image 2,让它解读适我主义,没有给其他提示词,它居然也能整合这么长的文字直接生图。
所以说,这年头媒体是好干也不好干。好干的是AI越来越成为强大的辅助和帮手,不好干的是AI假信息带来的干扰,令人真假难辨。比如下面这张图,要不是豆包的形象不太准确,猛一看谁能想到是AI伪造AII?由此可见,产品/品牌有个具体的形象IP还是重要的,至少能降低AI造谣率。
除此之外,我们也全方位实测了一波,结果不会画画和用PS的我们,现在已经开始认真考虑去接设计商单的可能性了。
接下来,我们就从目前最热门的几种玩法和测评维度,直观地感受一下GPT Image 2的统治力到底有多强。
1. 社交媒体截图
由于GPT Image 2能够生成极其逼真的软件界面图,一时间各种二创、玩梗、“假新闻”层出不穷。可以说,至此,以后截图这件事已经完全没有公信力了,发布官方声明恐怕都要打上一句“此处不是AI生图”以示严肃性。
罗永浩接任Apple CEO:
Sam Altman和马斯克在抖音直播间卖瑜伽裤:
马斯克直播带货特斯拉周边:
我们也试着让GPT Image 2生成了一张“Tim Cook加入华为”的微博官宣图和热搜图。它自动生成了很多衍生词条,比如“鸿蒙新品发布会”“华为和苹果合作新进展”,还有“Tim Cook回应加入华为”,形成了一个极具真实感的闭环。
在同人创作中,有一种经典的“捡手机文学”,通过假装捡到了某个角色的手机,模拟角色的聊天记录、朋友圈等。
于是我让GPT Image 2生成一张芙莉莲的朋友圈截图,结果不仅UI界面无可挑剔,配图、文案和评论也十分贴合人设。
芙莉莲的冷淡和超然、辛美尔的温柔、海塔对魔法的敏感、费伦的勤奋…… 都通过短短几句评论完美呈现,感觉又看了一集动漫……
又让它生成了一张五条悟的X账号主页,依旧轻松拿捏:
2. 营销设计
电商营销可以说是AI生图模型最具商业价值的落地场景之一,于是我们测试了让GPT Image 2根据服装平铺图生成模特图。
AI模特身上的衣物完全忠于平铺图,几乎是1:1精准还原了所有细节,而且表情、姿态、场景都非常自然真实。
再来测试一下GPT Image 2对品牌设计语言的复刻,假如鸡毛掸子是苹果的产品,那它在苹果官网的Landing Page会是怎样一种画风呢?
优雅,实在是太优雅了。GPT Image 2完美复刻了苹果官网的视觉,干净利落的无衬线字体、大面积的灰白色留白、恰到好处的模块化布局,这个味实在太对了。
配合上略带戏谑的文案,“除尘,从未如此优雅”“Think Dust Different”,把玩梗的幽默感和设计的高级感融合得天衣无缝。
你还可以让它生成风格更本土化的618大促商品详情页,它甚至帮我们想好了价格套路,日常399元,然后设置了满399领100元的优惠券。
3. 教学演示
不只是电商场景。
我们试了下,在不喂给GPT image 2任何文档和资料的情况,直接让它制作知识图解类的复杂图片也是可行的。
提示词:请生成一张高质量竖版科普百科图,介绍GPT image 2。这是一张兼具“图鉴感、百科感、信息结构感、收藏感”的模块化科普信息图。整体风格参考高级博物图鉴、现代百科书页、生活方式知识卡和社交媒体高传播信息图的结合,全中文。
请让画面包含:
- 一个清晰漂亮的主题主视觉
- 若干局部特征放大细节
- 多个圆角模块化信息分区
- 清楚的标题层级与重点标签
- 简洁但丰富的百科内容
- 可视化评分、要点总结或Top 5模块
-不要蓝紫色
生成的图片里,亮点细节抓得准,信息也是准确的,还给自己做了用户评分和使用小贴士。要说不足,就是应用场景里的小图文字又出幻觉了。
4. 游戏UI拟真
我又让它生成一张特朗普变成《原神》中大Boss的野生实机演示图,除了右边队伍的角色名有两个字不太清晰之外,整体十分精细,完美复刻了《原神》的战斗UI,包括右上角的小地图、右侧的角色队伍列表(连角色头像的特征都能清晰辨认)、底部的血条、技能图标以及右下角的UID水印。
5. 漫画分镜
漫画分镜图需要模型在同一张长图中处理不同分镜,维持角色一致性和叙事连贯,并添加文本气泡,是对AI生图模型的一大考验。
我让GPT Image 2生成一组哆啦A梦被《死亡笔记》中夜神月威胁利用的漫画分镜图,可能是因为涉及复杂剧情叙事和多张图片,这次生成时间较长,但结果依然惊艳。
6. IP周边 / 联名
随手拍了个办公桌上放着的新榜周边,让它设计一个IP形象。
这是它做的整套IP设计,有三视图、表情包、GPT自己编的角色设定,还有一些衍生周边。
提示词:围绕上面的形象,设计一个IP
IP有了,那再试试联名设计。比如,和星巴克的联名。从限定饮品到马克杯、毛绒挂件、帆布袋,应有尽有,甚至编了一段联名故事。
我又让它设计了和泡泡玛特联名,要求具有春天的气息。
然后它想出了一组盲盒,6个常规款+1个隐藏款,全都粉粉萌萌的,太可爱了。
7. 文字渲染
从上面这些案例里,我们已经能感受到GPT image 2强大的文字渲染能力。这也是模型最值得说道的地方之一。连nano banana 2拿捏不好的汉字,它处理起来也非常惊艳。
为了更深刻地有个感受,我们又选了几个字多的案例来测。
让它做一张中英文菜单。
提示词:一块中英双语咖啡馆菜单黑板,上面有中文今日特调和英文Daily Special
这个结果,第一眼不会觉得是实拍了一家咖啡馆的菜单吗?
我只说了特调,它自动完善了全部菜单,不仅有咖啡,还有不含咖啡的饮品和甜点。整体的排版挑不出一点毛病,没有任何乱码。
菜单相对来说还有规则可循,如果是更个性化的风格呢?
于是我们试了试让它做手帐。
提示词:生成一张手绘子弹笔记风格的记录去上海旅游3天的手账。
生成的图片里,它不仅自己规划了3日行程、美食打卡,还集齐了手帐的多要素,比如花费、照片、心情记录。而且,行程信息我看了下,是真的可行,不像有些离谱的旅游攻略会安排你一天时间从南到北打卡。
8. 多图融合
最后,我们决定来测测GPT image 2在真人照片的处理上效果如何。
没想到,这一测让我们发现了华点。
上传了四张照片,让它把三张单人照片变成第四张合照的pose。
提示词:图1、图2、图3的人物仿照图4的三只猫拍vlog图片
这是生成结果:
抽了几次卡,罗老师还是有一些崩溃。除此之外,场景和构图都一模一样,马斯克的还原非常逼真,image 2似乎在处理亚洲人的一致性上没那么好。
有点不信邪,我又试了一次。保留老罗,但换一张参考图,另外找了三个不同肤色或性别的人物。
没抽卡,这是第一次的生成效果,粗看还是还不错的。
人物的一致性提高了,老罗也正常了。而且照片的清晰度和细节,比我给进去的还要好。整个场景中,还被加入了不少中国元素,墙上的“发财如意,万事胜意”相当有精髓了。不过细看麻将,还是有很多可以优化的地方。
还有很多其他的玩法,比如,玩梗电影海报:
追星直拍:
制作专属漫画:
测到这里,GPT image 2整个在设计和审美上的能力已经展现无遗,难怪很多人又开始担心设计师的生计不保。
我们身边的设计同事也说,GPT Image 2基本完全替代了普通设计,“80%的需求都够用了,如果单纯做海报,完全能把小店的设计成本全部覆盖”。
毕竟上一代的王(Nano Banana2)已经让人惊讶,而GPT image 2在Arena.ai排行榜上的评分竟然比它又高出了242分。
这样的进化速度,我们确实无法预估明天会是什么样。
欢迎分享、点赞、推荐
一起研究AI














