以及突破这个问题需要哪些
Posted: Tue Feb 11, 2025 6:45 am
所有这些基本模型都需要大量的计算资源才能扩展。我们相信“Scaling Law”,这与LLM的Scaling Law类似,但是Embodied Intelligence和Robotics的Scaling Law还有待研究,所以我们正在这方面努力。
Nvidia 的另一个优势是模拟技术。 Nvidia 在成为人工智能公司之前是一家图形公司,因此我们在构建模拟(例如物理模拟、渲染)和实时 GPU 加速方面拥有多年的经验。因此,当我们构建机器人时,我们大量使用模拟。
Stephanie Zhan 模拟策略很有趣。您认为为什么大多数行业仍然非常关注现实世界的数据并采取相反的策略? Jim Fan 是的,我认为我们需要各种数据。仅依靠模拟或现实世界的数据是不够的。
所以,在GER(Embodied Agents Research Group),我们的数据策略大致分为三个部分:第一个是互联网数据,比如标签和在线视频。二是模拟数据。我们使用 Nvidia 的模拟工具来生成大量的合成数据。
第三个是实际的机器人数据,我们通过在机器人平台上 波兰手机号码数据 操作机器人来收集和记录这些数据。我认为成功的机器人策略应该有效地使用这三种类型的数据,将它们整合在一起并提供单一的解决方案。 Sonia Huang 你刚才提到的数据是实现基本机器人模型的一个关键瓶颈。
您能多谈谈您对这个观点的信念大数据吗? Jim Fan 好的,我认为我刚才提到的三种不同数据类型各有利弊。首先是互联网数据,它是最多样化的,包含大量的常识性先验知识。
例如,网上的大多数视频都以人为中心,因为我们喜欢自拍并记录彼此进行各种活动,而且也有很多学习视频。我们可以利用这些数据来了解人如何与物体交互以及物体在不同情况下的行为方式,这为基本机器人模型提供了常识性先验知识。
然而,互联网数据没有动作信号,我们无法从互联网上检索机器人运动控制信号。这就引出了另一种数据策略,即使用模拟。在模拟中,您可以执行所有操作,并且可以在特定环境中观察这些操作的结果。模拟的优点在于它本质上是无限的数据,并且数据量随着计算资源的增加而增加。
Nvidia 的另一个优势是模拟技术。 Nvidia 在成为人工智能公司之前是一家图形公司,因此我们在构建模拟(例如物理模拟、渲染)和实时 GPU 加速方面拥有多年的经验。因此,当我们构建机器人时,我们大量使用模拟。
Stephanie Zhan 模拟策略很有趣。您认为为什么大多数行业仍然非常关注现实世界的数据并采取相反的策略? Jim Fan 是的,我认为我们需要各种数据。仅依靠模拟或现实世界的数据是不够的。
所以,在GER(Embodied Agents Research Group),我们的数据策略大致分为三个部分:第一个是互联网数据,比如标签和在线视频。二是模拟数据。我们使用 Nvidia 的模拟工具来生成大量的合成数据。
第三个是实际的机器人数据,我们通过在机器人平台上 波兰手机号码数据 操作机器人来收集和记录这些数据。我认为成功的机器人策略应该有效地使用这三种类型的数据,将它们整合在一起并提供单一的解决方案。 Sonia Huang 你刚才提到的数据是实现基本机器人模型的一个关键瓶颈。
您能多谈谈您对这个观点的信念大数据吗? Jim Fan 好的,我认为我刚才提到的三种不同数据类型各有利弊。首先是互联网数据,它是最多样化的,包含大量的常识性先验知识。
例如,网上的大多数视频都以人为中心,因为我们喜欢自拍并记录彼此进行各种活动,而且也有很多学习视频。我们可以利用这些数据来了解人如何与物体交互以及物体在不同情况下的行为方式,这为基本机器人模型提供了常识性先验知识。
然而,互联网数据没有动作信号,我们无法从互联网上检索机器人运动控制信号。这就引出了另一种数据策略,即使用模拟。在模拟中,您可以执行所有操作,并且可以在特定环境中观察这些操作的结果。模拟的优点在于它本质上是无限的数据,并且数据量随着计算资源的增加而增加。