首页 科技快讯 OpenAI 神秘硬件细节曝光,我用AI 还原了真机,注入苹果设计灵魂

OpenAI 神秘硬件细节曝光,我用AI 还原了真机,注入苹果设计灵魂

来源:晰数塔互联网快讯 时间:2025年05月26日 20:12

本文来自微信公众号:APPSO (ID:appsolution),作者:发现明日产品的,原文标题:《OpenAI 神秘硬件细节曝光,我用 AI 还原了真机,注入苹果设计灵魂》

这段时间,有一款神秘AI硬件吊足了网友们的胃口——比肩iPhone和MacBook的使用场景和频率,但不带屏幕,又不是AI眼镜、AI耳机、AI pin、iPod……它背后的老板还放言要「量产1亿台」

OpenAI CEO奥特曼和苹果前首席设计官艾维联创的io公司,究竟用AI捣鼓了什么「开辟新赛道的硬件设备」,好难猜啊!

于是,虽然奥特曼透露计划明年末正式发布该产品,但现在已有不少X网友忍不住打起了AI「猜」图的主意。万一它知道些「内幕」呢,对吧?

目前市场上有关io首款硬件设备细节的爆料,主要有以下几点:

1.

无屏幕,通过内置摄像头和麦克风实现外界环境交互

2.

外形设计风格类似iPod Shuffle

3.

未采用AI眼镜、智能手机、耳机这几种当下流行的AI硬件形态

4.

比AI pin大一些

5.

有挂脖式设计

6.

可以与智能手机、PC联动

话不多说,先来看看AI创作博主Ben Geskin在X上甩出的「io产品图」,有近9000人次的X网友前来围观。

综合来看,上图不仅覆盖了这几点核心爆料信息,印上了自家金主OpenAI的Logo,还设计出了一种不常见的AI硬件形态——毕竟多少有点「撞脸」更常见的剃须刀、按摩仪、充电宝……

由OpenAI的ChatGPT生成的「GPT版Apple Watch」:

不是AI眼镜、耳机自带摄像头,因此推导智能手表设有摄像头?倒也是说得过去。

由xAI的Grok生成的「便携桌面版AI摄像头」:

这种场合,怎么能少了拥有当前「地表最强文生视频模型」Veo 3的Google呢?那么,Google最新版文生图模型Imagen 4的表现如何,让我们直接请出Gemini,先睹为快。

爱范儿把同一套「预测io产品图」的提示词,分别抛给了搭载Imagen 4的Gemini、搭载GPT-4o的ChatGPT以及搭载Grok-3的Grok,然后它们各自给出了如下模拟产品图。

单次此轮生成效果来看,三者都基本覆盖了爆料信息中的产品设计要素。其中,Gemini和ChatGPT的产品图更贴合可挂脖的设计点,而这两者相比之下,Gemini生成的产品图在视觉质感上会略胜一筹。

按照Google官方的说法,Imagen 4能够更清晰地呈现诸如皮肤、毛发、复杂纹理等图像细节部分,也更擅长创作「照片级」、「写实风格」的AI图像。同时,其宣称Imagen 4所生成的AI图像支持各种长宽比,且分辨率高达2 K。

不过有一说一,Gemini所设计的这款io产品「长得有点人山人海的」,越看越像Apple Watch+AI pin+登山包挂绳的结合体……

另外,Gemini还同时给出了能体现「io新产品与智能手机、PC设备隔空联动」的示意图。

并且,该AI模型进一步升级了拼写、排版方面的出图质量,可优化贺卡、海报、漫画等场景的AI创作

鸡蛋盒外印刷包装上的英文内容清晰、准确、美观:

近期走红网络的像素风漫画也能拿捏:

Imagen 4现已在Gemini App、Whisk、Vertex AI,以及Workspace的PPT、Video、Doc等产品中上线。

据Google I/O大会方面透露,Imagen 4后续将推出一个快速版本,届时其AI生图速度将是上一代Imagen 3的10倍,让我们一起拭目以待吧。

一位细节控的摄影师

如果说prompt关键词还原度、画面主体内容完整度,现在市面上主流的文生图模型都能做到「有鼻子有眼的了」——总体水平相差并不大。

因此,在图像生成质量这块儿,Google开始卷细节了,宣称Imagen 4有「更细腻的色彩」和「更精致的细节」。这听起来没什么实感,还是得「用图说话」。

基于同一套提示词:

一只金毛狗在沙滩上找贝壳(a golden retriever finding shells on the beach)

爱范儿对比了Imagen 4模型、Imagen 4上一代模型Imagen 3,以及豆包Seedream3.0所给出的图像效果。

这幅由Imagen 3生成的AI图像中,主体金毛狗的神态、贝壳的纹理、狗爪踩沙滩的痕迹,背景中的蓝天白云、海浪轻抚,都十分清晰和逼真。

并且,仔细看金毛狗的毛发似乎还被海水打湿了,一绺一绺的。

其实刚看到Imagen 3生成的杰作时,有点担心Imagen 4会不会打不赢。

不过,后者确实也没让人失望,用实力演绎了什么叫做「盘顺条亮」

首先,从整体来看,Imagen 4生成的图像色调更柔和,色彩也更自然,例如天蓝色渐变的天空、远深近浅的大海。

再者,从局部来看,金毛狗的毛发细节满满,不仅更有光泽、光影分布更匀称,而且还原了蓬松感,看起来就很好撸。

另外还有一个细节处理也很亮眼,那便是狗子的眼神。图像中金毛狗的眼神看向了沙滩上的贝壳海螺,对应了prompt中的「正在找(finding)」。

作为一组对比参照,豆包的表现也很抗打。下图虽然整体色彩偏暗,但画面细节也十分丰富,例如海风吹起的浪花激荡、海风吹动的狗毛根根分明、金毛刨出贝壳后爪子粘上了不少沙子……

而Google官方给出的示例中,Imagen 4还能「细节控」到「指哪刻画哪」。卡皮巴拉短而硬的皮毛、油画的笔触、泡泡的光影、水晶表层的构造都可以准确地捕捉到。

一位美商高的设计师

当爱范儿向最新Gemini 2.5 Flash版本的Gemini提出,「设计一款带电子屏的帆布包,有大中小型号」时,这位多模态AI助手花费10秒左右,便交出了如下设计图。

该设计图很直观地展示了「帆布包」和「电子屏」两个设计元素,并且左边一列标注了大、中、小的字样,右边区域则通过一些类似于「水杯」、「笔刷」的参照物,来体现不同尺寸的区别。

而且值得一提的是,其外观样式设计整体线条流畅不生硬,还保留了一些「手绘」的感觉。

然后,爱范儿进一步要求Gemini写明电子屏帆布包的具体尺寸。从此次生成结果来看,其主要英文单词和罗马数字都较为清晰且拼写准确,但涉及英文单位、标点符号的部分则会出现乱码的情况。

如果对于生成结果不满意,点击UI聊天框界面的「更新(Update)」选项,Gemini会擦除此条生成结果,根据新输入的prompt重新执行输出。

上述步骤实际生成结果与提示词的误差不算太大,需要重新调试生成的地方并不多。

不过,轮到相应海报、邀请函的设计时,如果提示词中有语义较为模糊的地方,Gemini很大可能就会错意了。

Gemini先是根据电子屏帆布包「Canvas Connect」的产品设计图,给出了左图的产品海报。接下来,prompt要求是让它改一下海报的配色,主色调是棕色和绿色,其余部分不变。

然而,由于prompt中没有写明「帆布包」的配色不变,Gemini更换海报底色时,把帆布包的配色也一并改了,如左图所示。

改写这段prompt后,Gemini做到了仅更换海报而非产品的配色,主题色从粉色变为绿色。其从思考prompt背后的用户需求,到理解匹配需求,再到生成AI图像,总耗时大约是10秒左右。

而且,无论是电子屏的画面,真人模特的动作、神态,还是文字内容,都无明显改动。这个案例综合反映出Imagen 4模型文生图的可控性较强,文字排版较为美观,大体上可复用。

可惜的是,一些成段、成片的文字内容,目前很大程度上还需要依赖精细prompt来控制调试。

别急,Imagen 4还有许多设计玩法等着一众网友们去探索呢。

爱范儿试了一下,发现它可以把海报中的真人模特,直接替换成发型、穿搭、动作都较为贴合的卡通人物形象,即上图最右侧那张海报。这也不失为懒得P图美颜时的一种交图思路。

不过,如果不提出具体要求,海报原有的排版也会随之改变。这点目前需要在prompt的部分多花些功夫。

或者来一个「风格活泼有趣」、「文本内容隽永」、「适配社交媒体」的电子邀请函吧。

最后,别忘了让Gemini来一段自带emoji和tag词条的宣发文案,「邀请你共同见证Canvas Connect新品发布时刻#TechStyle」。

我们正在招募伙伴

简历投递邮箱hr@ifanr.com

✉️邮件标题「姓名+岗位名称」(请随简历附上项目/作品或相关链接)

相关推荐

OpenAI 神秘硬件细节曝光,我用AI 还原了真机,注入苹果设计灵魂
荣耀 Magic6 保时捷版真机曝光:还原保时捷跑车神韵
联手苹果传奇设计师,OpenAI想造硬件?
OpenAI AGI时间表疑似泄露,神秘模型Q*细节曝光
猿辅导推出“学练机”:面向中小学生,入局千亿智能硬件市场!
苹果官宣“硬件新成员”,带屏HomePod 会是今年最重要的AI 硬件吗?
OpenAI投资的AI硬件,会是下一个iPhone么?
苹果新品发布会最强前瞻:iOS 14沦为配角,神秘硬件或登场
确定了!iPhone 15“真机”曝光:C口、固态按键实锤
确定了!iPhone 15 “真机”曝光:C 口、固态按键实锤

网址: OpenAI 神秘硬件细节曝光,我用AI 还原了真机,注入苹果设计灵魂 http://www.xishuta.com/newsview136570.html

所属分类:行业热点

推荐科技快讯