文章来源:
腾赚网
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 wulanwray@foxmail.com 举报,一经查实,本站将立刻删除。
朋友圈最近被“3D打印手办”刷屏,明星、宠物纷纷变身模型,配上“Nano-banana”字样包装盒。看似是手办热,实则一场AI图像热潮悄然兴起。社交平台上相关话题热度飙升,股市也迅速反应,3D打印概念早盘拉升,多只个股涨停。

这场热潮背后的真正推手,是谷歌推出的图像生成与编辑模型Nano-banana。它能通过上传图片和输入指令,一键生成“手办风”图像,效果逼真、操作简便。模型正式名为Gemini 2.5 Flash Image,上线不久便在AI排行榜登顶,远超GPT等主流模型。
除了“做手办”,Nano-banana还能融合多张图片、局部重绘、风格迁移,甚至根据地图箭头生成风景图。其核心能力包括跨图一致性、多图融合、指令式编辑,以及依托Gemini的强大语义理解。目前用户可通过Gemini App或API使用,成本低至每张图不到0.04美元。
海外平台如Adobe、Figma等已集成该模型,验证其生产力提升。华福证券认为,谷歌模型出圈标志多模态技术突破,未来多模态应用将加速爆发。OpenAI与Meta也在该领域频频发力,ChatGPT推出图像生成功能,Meta联手Midjourney开发新模型。
多模态已成为大模型竞争焦点。华泰证券指出,原生多模态模型优势明显,商业化进程快于文本产品,算力与应用端均迎来投资机会。视频生成模型在国内领先,广告、教育、创作等领域需求旺盛,多模态奇点将至。
抱歉,评论功能暂时关闭!