• 首页
  • AI工具集
  • AI资讯
  • AI活动
  • AI社区
  • AI短剧
  • AI创作大赛
  • AI小说
  • AI绘画
    AI视频
    AI对口型
    视频转动漫风格
    AI创意二维码
    AI艺术字
    AI智能抠图
  • AI短视频创作热门-AI社区
AI 对话

群核科技SpatialLM:开源空间理解模型让机器人理解3D世界

群核科技SpatialLM:开源空间理解模型让机器人理解3D世界
元元
2025-03-20 16:26:01

群核科技SpatialLM:开源空间理解模型助力机器人训练新突破

近日,杭州科技公司群核科技再次引发业界关注,其开源的空间理解模型 SpatialLM 荣获谷歌论文致谢。该模型创新之处在于,通过普通视频理解物理世界的几何关系,是机器人训练领域的一大突破。

SpatialLM 的核心在于将手机视频转换为三维空间信息。用户仅需用手机拍摄家中布局,SpatialLM 便可生成详细 3D 场景,包含房间结构、家具位置和通道宽度。这大大降低了机器人训练成本,提升了训练效率。

空间信息

SpatialVerse虚拟训练平台

在 GTC2025 大会上,群核科技同时展示了虚拟训练平台 SpatialVerse。该平台结合 SpatialLM 生成的数据,允许机器人在模拟环境中进行避障、抓取等训练,形成从认知到行动的闭环。简言之,机器人不仅能“看”到空间布局,还能理解如何操作。

SpatialLM 的工作原理

SpatialLM 的工作原理是将视频拆解为帧,提取物体细节并构建点云模型,再转化为结构化的 3D 布局,记录物体尺寸和位置等关键信息。与传统方法相比,SpatialLM 不仅节省资源,还提升了机器人的空间认知能力。

技术的独特之处

该技术使机器人能够像人类一样理解复杂环境变化,快速适应并执行任务。无论是家庭物品还是工作工具,SpatialLM 都能帮助机器人。这种能力对提升机器人在真实环境中的表现至关重要,尤其是在具身智能领域。

重塑机器人训练的未来

群核科技通过开源 SpatialLM 和 SpatialVerse,正在重塑机器人训练的未来,使其能够在真实世界中灵活应对各种挑战。

想了解更多AI创作软件工具请关注AI人工智能网站--AITOP100平台--AI工具集

0
0
文章来源:AI TOP100
免责声明:本文不代表本平台立场,且不构成投资建议,请谨慎对待。
全部评论
暂无评论
相关资讯
  • FlowSpeech:全球首个“书面语变口语”的TTS,让AI语音更懂人情味

  • Midjourney推HD视频模式:分辨率提升4倍,专为专业用户打造

  • AI国际象棋大赛:Grok4领跑,DeepSeek惜败,Kimi K2淘汰惹争议

  • 通义万相国际版wan2.2开源第8天:色彩控制

  • 谷歌AI编程助手Jules正式上线:异步代码修复,重塑开发新体验

热点资讯

Higgsfield AI消散特效制作完整教程:一键打造电影级Disintegration视觉效果

8天前
Higgsfield AI消散特效制作完整教程:一键打造电影级Disintegration视觉效果

测试文章

7天前
测试文章

FlowSpeech:全球首个“书面语变口语”的TTS,让AI语音更懂人情味

7天前
FlowSpeech:全球首个“书面语变口语”的TTS,让AI语音更懂人情味

测试文章显示1111111

7天前
测试文章显示1111111

每日AI资讯-2025年08月07日

7天前
每日AI资讯-2025年08月07日
分享
0
0

欢迎来到AI Top100!我们聚合全球500+款AI智能软件,提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台,让您轻松了解全球AI领域动态,并为您提供优质服务。

合作伙伴
联系我们
加入AITOP100社群
加入社群
AITOP100商务微信
商务微信
相关链接
服务及隐私政策
网站地图
关于我们
粤ICP备2022124843号-2粤公网安备44030002004505广播电视节目制作经营许可证:(粤)字第00712号Copyright © 华强方特(深圳)动漫有限公司 版权所有