
对AI的“核心提示”下注是定义下一代汽车,甚至产品的权利,以及对技术,用户和商业模式的全面重建。 5月-Set |编辑Zhang li | Xing最近,Li Xiang带来了他的VLA驾驶员模特再次谈论AI。自从他上次谈论AI和明天的完美未来以来,已经有130天了。 130天不长,但足以改变自动驾驶和AI的世界。 1月下旬,DeepSeek发布了DeepSeek-R1模型的开放资源,该模型继续打破了圈子,并引发了中国人工智能繁荣的新旋转。在最后的AI对话中,李Xiang强调了基本模型自行开发的重要性:“在接下来的几年中,应确保我们大语言模型的MGA基本模型应该是行业前三名。” DeepSeek-r1的出现。随着vla的理想转向VLA(VIS语言)(VIS语言)(VIS语言)UAL语言动作模型),即基于DeepSeek的开放来源的语言模型的开发。选择站在巨人队的肩膀上,这是VLA的完美自动ACCELERA,节省了将近9个月的时间和道路-100万元的成本。问题更为重要。在解决问题的过程中,果肉混凝土。米彭和尼奥不仅是完美的,两支新车制造力量在大约同一时间与完美的企业开始,还押注AI。 Li Xiang说:“ AI是完美的未来的总和。” Nio的创始人Li Bin坚持认为,“成功的智能电动汽车公司也必须是一家成功的AI公司”。米彭汽车公司的创始人米彭大喊“ All In In In In In In In In In In In In In In In In In In In In In In In In In In In In In In In In Alloa AI汽车公司。实际上,它的背后是定义下一代汽车,甚至产品的权利,以及使用它的技术,用户和商业模式的全面重建。 1。汽车制造已经进入“新战场AI“ Wei Xiaoli对AI的决定可能会得到更深入的监控
2024年初,特斯拉智能驾驶团队的负责人介绍了X(以前是Twitter),FSD V12已完全超过了仅几个月培训后近年来积累的FSD V11。 FSD突然变得更强大,因为他们使用了新的端到端神经网络技术来结合传统的理解,决策和对模型的控制,并通过输入信息(例如人们开车时)直接产生实施操作,他们立即根据道路条件做出反应。
如此成功的发展是自主驾驶领域的“出现”时刻,这与大语言模型的Chatgpt 3.5的出现相当。尽管他与特斯拉(Tesla)作战的小米(Xiaopeng2.3.6表现良好,因此您应该从这里知道。”
在端到端大型模型变得流行之前,自主驾驶的主流是模块化设计,其中包括三个主要模块:感知,决策和实施。该信息已发送到步骤步骤。汽车传感器(例如雷达,相机等)等效于人眼和耳朵,并在制定模块中被发送到与人脑类似的决策模块中检测到的环境信息。这个大脑充满了不同的规则。决策模块计划基于这些政策的最佳驾驶路线,并最终告知实施模块,该模块与人的手和脚相等,执行转向,加速,制动和其他动作。
模块化设计的Mosthuge缺陷之一是驾驶场景在不断变化,而决定模块的规则只能写更多。 FSD 11代码具有多达300,000行,这极大地影响了EFF实施的显着性。更严重的是,当遇到规则不写的场景时,自动驾驶模块丢失了。
端到端设计是一个完全不同的想法。外部信息是对自主驾驶模型的输入,然后直接输入实现的动作。在整个决策过程中,人类统治没有干预。最好仅依靠模型来学习如何驾驶。因此,FSD V12代码从剩下的300,000行减少到仅剩下3,000行,并且级别信息的交付成为端到端交付,并且信息的传递变得更加准确,没有损失,这也可以使大型模型更准确地了解全球情况。
特斯拉将大量的真实驾驶数据馈送到端到端的大型型号。就像一所主要学校的学生一样,有意识和积极的教育。通过模仿和观察人D活跃的视频,与旧司机出现的智慧相同。
在特斯拉的影响下,国内智能驾驶员的路线也开始移动这项技术,端到端的大型车型将在2024年开始加速他们进入汽车。
但是,这个研究过程需要很长时间,并且可能会出错,因为您必须给小学生的时间和空间成长,而霍斯的学习完全处于黑匣子状态。这种无法解释的将严重影响研发的发展并解决问题,因为当问题出现时,研究人员不知道在哪里改进。
因此,当特斯拉面临复杂的道路条件或极端条件时,这并不令人满意。例如,它不能确定严重雾和大雨的障碍,但是很难在短时间内解决。当前已知的路径是继续提高数据的质量和数量,但是实际和重要的数据需要时间来积累。
国内端到端modEl与特斯拉并不完全相同。米彭采用了一种“端到端”方法,该方法将大型模型介绍给理解,计划和其他模块,并通过手动政策进行连接。这是MEDYO折衷解决方案。但是该连接仍是定义的,这意味着一定程度的信息丢失,而自动化并不令人愉快。
2024年理想技术的路径被命名为具有分离模型的端到端 + VLM(语言语言模型),并且完美的方法是通过快速和缓慢的系统来解释的。
前者就像条件反射。它可以处理最常见的情况,后者就像经验丰富的驾驶员的大脑,实时检查道路状况并提供最佳的驾驶计划,但仍然没有真正结束。
2。型号:端到端2.0进化
同时,似乎被端到端1.0捕获的NIO选择了一条更激进的路线,直接进入了明智的驾驶行业的新技术 - St世界时代模型。
2024年7月,Nio Innovation Technology Day发布了NWM(Nio WorldModel)的首个智能驾驶世界模型。世界模型的基本功能基于理解信息,想象力的推论,从而计划轨迹。
实际上,世界模型的概念首先出现在人工智能领域。
要简要理解,这是一个框架,通过了解现实世界的物理动态(例如运动,力量和空间关系)来模仿真实环境。该模型使用多模式输入(文本,图像,视频,传感器数据)来预测未来的场景,并为端到端大型自主驾驶模型生成合成数据作为培训的基础。
中国的驾驶环境比美国更为复杂,但是市场迫不及待地想要在上网前慢慢学习并达到旧驾驶员的水平。在自主驾驶领域将有助于解决数据和质量量的问题,并更有效地处理无尽的角落病例。
尚不清楚如何启动Nio的世界模型NWM(Nio WorldModel)的性能。预计最初将在今年4月推动它,但李本宣布,由于行业和信息技术部的新法规的变化,有必要等待公告,然后才能推动。
同时,Perfect,Xiaopeng和其他人也将其演变提高到端到端2.0,他们专注于开发更高的VLA级别(视觉语言操作)端到端大型模型。
此时,在AI Talk上,理想启动了VLA驱动程序(视觉语言端到端)大型模型。 Li Xiang解释说,他分为三个阶段,尤其是昆虫和动物智力,人类的智力和人类智力,将明智的辅助驾驶分开。模块化属于昆虫和动物智力,端到端属于昆虫和动物智能,而VLA属于人类智力。
Li Xiang提出,在VLA舞台上,明智的协助驾驶可以像男人一样观察世界。世界模型使用3D视觉和2D的集成来产生更现实的物理世界,而不仅仅是在VLM阶段可以看到一张图片。此外,VLA还有自己的大脑系统,它不仅可以看到物理世界,而且可以理解物理世界,拥有自己的链系统并具有推理能力,并且可以执行像人类这样的MGA复杂行动。
米彭还建立了LVA基座模型。据报道,这是一个超大规模的自主驾驶模型,具有720亿个参数。它使用大型语言模型作为情节网络,并使用大量质量的驾驶数据进行训练。它有能力理解推理能力的视觉,长期思维链和动作产生的能力,以便它可以是作为人们的精致是基于对现实世界的充分理解。对推理和转变的各种理解会导致行动。
VLA专注于动作中的多模式输入,而世界模型则集中在预言和模拟氛围上。例如,两条路径也可以互相帮助,例如,世界模型可以为VLA提供长期存在的环境预测。
在对话中,Li Xiang表示,建议使用大量的实际数据与世界模型合作以生成数据以用黑色模型框来解决问题。简而言之,这是为大型VLA驱动程序模型开发测试模型。
3。电力力量:芯片竞赛
完成VLA大型模型培训后,需要需要进行计算强度和数据。 Chatgpt的成功已经能够与AI触发全球竞争,从而导致全球缺乏计算能力。计算的力量完全取决于芯片。 Wei Xiaolizhong的FirsT芯片是Nio。
Li Bin进入筹码的最初目标是省钱。 NVIDIA ORIN X通常用于高级辅助驾驶。单件的价格约为500美元,约为3,600元。基于4个ORIN X标准模型,光学芯片的成本接近15,000元。
2024年,在会议上,李·本(Li Bin)夺取了成功丢失口袋的Shenji NX9031。该口号是第一个汽车高性能智能驾驶芯片,一个带有Orin X的高性能是4。它具有至少具有AI Computing Power和ISP等关键指标的性能至少4倍。 Shenji NX9031包括超过500亿晶体管,采用了32核CPU架构,并且每秒可以持有超过6万亿美元的说明。
目前,这款Shenji NX9031配备了Nio ET9,它是汽车在汽车中正式制造的第一个开发的自发芯片。
nvidia放弃并过渡到自我开发的筹码是DIN由于算法的持续发展和端到端大型模型的发展,特斯拉已经走了道路,NVIDIA芯片无法满足自动驾驶公司的个性化要求。 FSD芯片的第一代特斯拉是2019年初的大众制造的。
小米芯片团队于第二年建立了大规模生产FSD芯片,并开发了自己的图灵芯片。该行业认为,米彭选择了一个7nm的芯片流程,其成本性能更高。根据小米的说法,图灵芯片具有40核处理器,两个神经网络处理单元(NPU),并且具有300亿个参数的支持模型。其AI计算的功率接近三个NVIDIA ORIN X芯片。就整体性能而言,它低于Nio芯片,但成本也较低,而Shenji NX9031的Kaya也是较低的。
Wei Xiaolizhong芯片中未出现的内容是完美的。据说,完美还推广了自己的芯片项目,名为“舒马赫”代码。这项目开始于Nio和Xiaopeng晚,芯片的结果尚未预期。目前,理想仍在NVIDIA的Thor-U Max中发展。
4.常规:从AI到机器人
WEI小米收集算法和计算能力并叠加很难获得的真实驾驶数据,而纯AI公司则具有一定的AI开发计划,并且它是否是芯片还是AI算法通常在工具外行业中是一般的。 Li Xiang仍然直接猜测:“将来的任何公司都将是一家人工智能公司。”
最接近智能驾驶汽车的AI行业是人形机器人,Dathey都需要找到复杂的环境,做出复杂而即时的决策,并且与技术有关,既涉及自然语言处理,计算机视觉,机器学习等。
特斯拉仍然是第一家加入人形机器人的汽车公司。它于2021年推出了擎天柱。马斯克对人形机器人也有很高的希望。他希望Optimus有PA通过特斯拉的其他业务。这句话有一些可信度可以证明。
但是,他显然相信。米彭是第一个投资于魏小岛的人形机器人研究和开发的人。它于2023年推出了第一代人类机器人PX5,并于2024年推出了人形机器人铁。预计工业大众劳动将于2026年开始,将特斯拉的大众劳动时间机器人束缚。
根据米彭的说法,铁采用了1:1的仿生设计,具有高水平的人性化。在178厘米的高度和70公斤的重量下,整个身体都装有62个主动的独立性和22个移动自由度。钢铁进入小米车工厂上班。
尼奥(Nio)仅在2025年才进入机器人,一个团队组成了大约20个人,准备制作机器人狗。
Li Xiang非常小心。他觉得自己绝对是未来的人形机器人,但今天不是。当前的任务是克服技术专业自动驾驶的斑点。根据Li Xiang对AI的最终愿景是基于硅的家庭,类人动物机器人只有几个小时。
从技术乐观的角度来看,以任何方式概括Technoloshame AI并不是一个夸张,并且业务前景非常清楚,但是我们必须解决的问题是真实的。建立长期困难,例如人才和技术困难,WEI小岛需要解决最紧迫的问题所需的问题是资本的问题。
自动驾驶,AI,芯片和机器人,每个都是“富含黄金的动物”。他曾经承认,米彭只为机器人投资了500亿美元。李·本说,投资研发芯片可能会使1,000个电池更换站,约为15亿元人民币。事实是,小米在2024年没有收入,而Nio的损失继续扩大。理想收入为80亿元,但增长率拒绝了。
资金障碍最终会影响分配在资源中,Andresources可以确定自主驾驶所开始的AI依恋的距离或严重程度。随着AI摊位的成长,它们可以像肌肉一样建造,也可以被“生态抗流行性”(如Jia Yueting)所消耗。良好的余额将继续尝试Wei Xiaoli。回到Sohu看看更多