京东开源图像模型JoyAI-Image-Edit

　　发布于2026-04-25　阅读（0）

扫一扫，手机访问

大象新闻·大象财富记者李莉张迪驰

最近，一条来自“京东黑板报”的消息，在AI和开发者圈子里溅起了不小的水花。

京东探索研究院正式开源自研的JoyAI-Image-Edit图像模型。这可不是一次普通的版本迭代，业内普遍认为，这是首个将“空间智能”深度内化于模型架构的开源成果。简单说，这套模型让AI不再只是“平面修图师”，而是进化成了能真正“看懂”三维空间格局，并对其“动手”编辑的工程师。它的厉害之处还在于，所有推理代码完全开源，开发者可以直接调用、部署，应用的大门算是彻底敞开了。

彻底解决传统模型空间逻辑混乱难题

以往用AI编辑图片，最头疼的是什么？空间错乱。移动个物体，背景或光影就跟着扭曲；换个视角，整个场景结构就“崩塌”。说到底，是AI对真实世界物理规律和空间逻辑的理解不够。

这次开源的JoyAI-Image-Edit，核心突破正在于此。它从底层就深度贴合真实世界的空间规律，在空间位置关系、多视角一致性、相机位姿感知乃至复杂场景推理等多个维度上进行了系统性建模。这意味着，模型不仅实现了在相机坐标下的视角变换、物体的空间位移与旋转，更实现了对场景几何结构的精准控制。

关键在哪里？它打破了AI“理解图像”与“生成图像”之间那道隐形的墙。现在，AI既能生成逼真的外观，更能精准把握图像背后的三维骨架。无论是移动物体、切换观察角度，还是调整物体间的相对位置，模型都能确保场景遵循几何规律，遮挡、光影过渡自然，从根本上杜绝了变形和逻辑错乱的老毛病。

有实验数据佐证，在物体移动精度、空间一致性这些衡量空间编辑能力的硬核指标上，JoyAI-Image-Edit的表现达到了世界一流水准。

三大空间编辑范式突破，融合15类通用编辑能力

那么，这套模型的“空间智能”到底能干什么？它带来了三大极具辨识度的编辑范式：

视角变换：用户只需用自然语言描述，比如“相机向左转30度，镜头拉远”，模型就能在严格保持场景几何一致性的前提下，生成全新的视角图像，就像真的指挥一台虚拟摄像机。

空间漫游：这更进了一步，支持连续的视角移动，可以生成在三维空间中逻辑连贯的多帧图像序列。你完全可以把它想象成在一个虚拟场景里“走动”观察。

物体空间关系操控：在确保整体场景结构稳定的前提下，对画面中特定物体进行位移、缩放等操作，同时自动处理好物体间的遮挡关系和光影变化，做到天衣无缝。

在实现上述空间级突破的同时，JoyAI-Image-Edit并没有变成只会解决“高精尖”难题的偏科生。它全面兼容并高效实现了包括物体替换、删除、添加，以及整体风格迁移、细节精修在内的15类通用编辑能力，覆盖了内容创作的绝大多数高频需求。

正因如此，结合其顶尖的空间理解技术，这套模型在处理长文本精准渲染、多视角一致性生成等行业公认的高难度任务时，优势就格外明显，真正做到了全场景、无死角的高效内容创作。

凭借这种领先的空间理解与编辑能力，JoyAI-Image-Edit的应用场景被极大拓宽。从电商内容生产、创意设计，到智能图像处理、3D模型重建，乃至当下火热的具身智能视觉感知领域，都能看到它的用武之地。

话说回来，尤其在具身智能领域，让机器人“理解”所处的三维空间是其与环境交互的核心基础。JoyAI-Image-Edit这类模型的推出，无疑为相关技术的研发提供了关键的底层能力支持。

本文转载于：https://www.163.com/dy/article/KQ01OKS50550B6IS.html 如有侵犯，请联系zhengruancom@outlook.com删除。
免责声明：正软商城发布此文仅为传递信息，不代表正软商城认同其观点或证实其描述。

上一篇：杨柳树用上“护发素” 飞絮两年不“炸毛”

下一篇：苹果自研AI服务器芯片Baltra曝光：直接采购基板，把控封装质量

产品推荐

售后无忧
立即购买>

DAEMON Tools Lite 10【序列号终身授权 + 中文版 + Win】

￥150.00
office旗舰店
售后无忧
立即购买>

DAEMON Tools Ultra 5【序列号终身授权 + 中文版 + Win】

￥198.00
office旗舰店
售后无忧
立即购买>

DAEMON Tools Pro 8【序列号终身授权 + 中文版 + Win】

￥189.00
office旗舰店
售后无忧
立即购买>

CorelDRAW X8 简体中文【标准版 + Win】

￥1788.00
office旗舰店

正版软件

苹果海外官网上架 Herschel Cloudform iPhone 斜挎包：可放置 AirTag 59.95 美元

苹果上架Herschel联名iPhone斜挎包，简约设计主打安全收纳最近，苹果美国官网的配件区悄悄上新了一款有意思的产品——与加拿大潮流品牌Herschel联名推出的Cloudform iPhone斜挎包。这款包提供了粉色和黑色两种经典配色，目前官方定价是59.95美元，如果换算乘软妹币，大概在4

14分钟前 0
正版软件

2026北京车展：卡尔动力发布新战略引领L4自动驾驶货运迈向万台新纪元

在2026北京车展的舞台上，卡尔动力以一系列创新成果成为焦点，展现出其在L4货运领域的深厚积累与前瞻布局。此次车展，卡尔动力不仅带来了前沿的技术理念，更通过实际车型和合作成果，描绘出未来货运的崭新图景。技术基石：从海量数据到货运通用模型技术突破的背后，是扎实的数据积累与模型迭代。卡尔动力在AI技

14分钟前 0
正版软件

雷军体验小米VGT超跑上车遇“小插曲”：网友笑称181cm身高成“阻碍”

北京车展亮相：小米Vision GT概念超跑登场今年的北京车展，小米带来了一款足够吸睛的作品——Xiaomi Vision GT双门超跑概念车。需要明确的是，这并非一款即将量产的车型，它的意义更在于展示小米在汽车设计领域的探索野心与技术储备。说起这款车的来历，还挺有意思。它源于索尼旗下那个大名鼎

14分钟前 0
正版软件

小米罗福莉LLM 公司应谨慎定价避免价格战引发恶性循环

小米集团 MiMo 负责人谈AI行业Token价格战：效率才是未来关键就在昨天，小米集团MiMo负责人罗福莉在X平台发表了一篇长文，直指当下AI行业愈演愈烈的“Token（词元）价格战”，其中的分析与判断，颇有些拨云见日的意味。 ▲ 图源：罗福莉本人社媒账号罗福莉的思考，主要由Anthropic

17分钟前 0
正版软件

海盗船推出 10 可编程键鼠标 IRONCLAW WIRELESS SE：26k DPI 130g

CORSAIR 海盗船 IRONCLAW WIRELESS SE 游戏鼠标上线各位游戏玩家，尤其是热衷于MOBA和MMO的朋友们，留意一下。CORSAIR海盗船最近新推出一款硬件：IRONCLAW WIRELESS SE游戏鼠标。这款产品定位清晰，直接瞄准了需要复杂操作和大量快捷键的游戏场景——它

17分钟前 0