Administrator
发布于 2026-06-29 / 1 阅读
0
0

🤖 Om AI发布VLX端侧流式多模态模型系列,具身智能走进“看见动得了”闭环

6月27日,杭州团队Om AI发布全球首个面向物理世界的端侧流式多模态模型系列VLX,一次性推出三款模型:VLX-Flow(实时流式感知,处理单路视频最快0.06秒)、VLX-Seek(3B参数,区域简点检索)、VLX-Go(0.6B参数,轻量级行动决策),构成“持续感知→精准定位→行动决策”能力闭环。该系列从第一天就以端侧原生架构设计,不依赖云端量化压缩。

值得关注的原因:CVPR 2026最热的流式多模态方向,被中国团队率先跑进端侧。这意味着具身智能从“试验室依赖云端运行”走向“真正部署到机器人、无人机、手机本地”。VLX-Go仅用0.6B参数就超越较大模型的导航表现,验证了“轻量级端到端”路线在物理AI场景的可行性,对机器人产业化落地具有里程碑意义。


评论