Featured image of post 2025 回顾

2025 回顾

2025年的生活回顾

目录

春去秋来,一年转眼就飞逝而过,相较上次的年终总结感觉没过去几天,结果春节又来了。话不多说,还是简要地总结一下过去的这一年。

技术思考

过去的这一年,工作重心仍然是在智驾大模型的研发上。今年已经能明显感觉到智驾进入了深水区,下一代的技术路线也基本看到了头,剩下的都是复杂的,令人头疼的,但是也是需要细心的工程调优工作。这也是为什么到了年底我选择了打脸去年的自己,跳进了具身智能这个很hype但是也很火热的深坑。

今年的智驾大模型,已经跟智驾类似领域/层级的大模型,我这边主要关注的有以下这些领域:(从名字也能看出今年的技术都是系统性工作了)

  1. 更复杂的思维链数据管道:到现在拢共做了两年的智驾大模型,发现最困难的以及最重要的还是数据,尤其是我们想构建复杂推理能力所依赖的思维链数据。虽然纯语言的大模型已经突破到超长上下文的agent调用数据了,但是据我所知智驾的数据在业界仍然还是停留在较为初步的场景解释+关键目标/事件识别+决策分析的构成阶段。能够灵活地、精确地生成针对多样场景的智驾思维链数据仍然是行业痛点。

  2. 更复杂的大模型RL系统:今年在工作上的一个很大变动就是年初Deepseek-R1的火爆催使大家赶紧在垂域大模型上也用上RL,各种RL框架也雨后春笋地火了起来——veRL、swift-RL、trl等等。RL在智驾这个领域有几个关键痛点:第一个是智驾数据规模庞大,经常是要高清图片多帧输入,甚至带上点云也有可能,这对数据流的管理和优化带来了很大的挑战;第二是驾驶场景要求的安全性,天生决定了智驾模型——哪怕是端到端小模型——都只能用离线强化学习,并且还没有靠谱的仿真器可以使用。第二点也是RL为什么在智驾领域铺开的核心原因。不过这一年的探索下来,离线RL在智驾上还是产生了一些收益,并且在针对思维链的RL上(这个可以做在线RL)也有一定突破,可以预见RL在未来的三到五年仍然会是智驾和其他大模型领域的重要技术手段。而各家公司做的好不好,在我看来,就看对RL训练基建的重视程度有多少了。

  3. 异步Agentic系统:Agentic大模型现在也是火的一塌糊涂,但是异步这个事并没有得到相同程度的重视,而在智驾领域大模型想要很好地发挥效果,异步体系基本是绕不开的。这里异步主要指的是多个模型可以以不同的频率进行运行,并在过程中相互交换信息。所谓的System0/1/2、快慢思考系统,都可以看作异步的一种实现。异步,对于LLM来说,目前的价值在于LLM agent如何有效使用调用运行时间很长的工具;对于智驾来说,异步则直接决定了大模型能不能以更高的频率接受信息的同时,做出更长更灵活的思考。异步这件事目前是underrated,但我预计会有更多的研究冒出来。

还有一些其他的零散思考:

  • 还是蛮同意马斯克的这个观点的:现阶段已经没有所谓的AI研究员了,可以认为99%的需求都是AI工程师。工程师也可以做研究,而反过来做AI研究一定需要扎实的工程能力和经验。
  • 对于智驾领域来说,还有个很重要的课题是panoramic、spatial的环境特征如何接入到大模型中(应该有很多公司都在看VGGT的接入了),这个问题对于具身来说也是有点重要(但重要性目前还不大),但是对于其他大模型应用领域来说还不是重点问题。

这次的年终总结大概会是最后一次系统地对智驾系统进行思考了。从今年(2026)开始,我的重心转向了具身智能(或者如一群师兄所说,我们还是叫他robotics比较好),它跟智驾有一些相似之处,但是我感觉他们相似的部分已经探索的差不多了,再往后的研究探索会慢慢开始diverge,会各自更多地开始研究自己领域独有的问题。

管理思考

上半年还在华子的体系里做跨部门项目管理,这段时间思考比较多的是在这种部门墙比较严重的环境里,怎么才能保护自己的团队不受挤占,以及怎么才能在多部门竞争赛马的前提下脱引而出。不过想来想去没有想到太好的解决方法,最后总结下来:1. 这件事受直属上司影响很大,他是最适合求助的人,如果他不重视的话尽早换老板;2. 这本身可能也是大公司病的核心病症,因此只能在未来如果自己有机会做团队组织优化的时候尽量避免了。(虽然也不清楚站在大领导的角度,这种事情的成因和全貌是什么样的)。

上半年还有个感触比较深的事情就是诺亚方舟实验室被重组成基础大模型实验室的过程。借由此机会我第一次在内部会议上见到了余大嘴。大嘴在会上提到他前两次大的挑战,一次就是把Mate系列手机从默默无闻干到国内第一,第二次就是把鸿蒙智行拉扯到行业第一,这次all-in大模型就是他的第三次挑战。他说这是他退休前的最后一份事业,如果不能把大模型做到行业领先(忘记目标说的前三还是第一了),他就自降职级哈哈。一场会下来还是挺有感染力的,我得到的启发是,他这种能屡次带领团队取得成功的leader所具有的素质可能有这么几个关键:1. 自信心超强,并且要能带动团队的士气,决不气馁;2. 目标一定要定得高,在他看来一件事要做,就要做到行业第一、世界第一;3. 以雷霆手段扫清团队障碍——在这样一个百人大会上他直接让大家发言提出有哪些业务受阻需要领导帮忙,这正是领导最需要承担,也是最能发挥领导能力的责任。

而下半年出来跟进时代前沿工具之后,思考的最多的就是当LLM coding agent到达当下这个水平,以及以后变得更强大之后,软件公司的管理方式、管理重点应该是会突变的。对软件开发员工的能力需求也是剧烈变化的。

You would have 50 people doing stuff and their interaction style is going to be naturally very hierarchical, because these 50 people are going to be working on this part of the system and not interact that much with these other people over here. But if you have five people each managing 50 virtual agents, they might be able to actually have much higher bandwidth communication among the five people, then you would have among five people who are also trying to coordinate, a 50 person software team.

Jeff Dean, Latent Space Podcast

正如上面Jeff Dean这段话所说,以后的公司架构有可能会变成少数人类员工加上大量的机器Agent,而人类员工在里面的职责应该就是:定方向、协调、评审决策、以及难以避免的给机器人agent擦屁股哈哈哈。这么看的话management的能力在未来只会越来越重要,这也意味着人才招聘的重点会从个人能力优秀,到管理协调agent的能力优秀了。

目前大模型做的好的领域仍然局限在少数纯软件交互的,能快速有效验证的任务上,但是这只是现状。从这里延伸出去:下一个会被攻克和颠覆的,是在物理世界能低成本生产和被验证的产品和技术。关于这件事,以后可能会专开一篇博客来讨论下~

工具革新

没想到是今年工具的变化比去年还大哈哈~

  • 开发:今年我觉得可以称为AI IDE爆发元年,Cursor已经火了一段时间但是实在太贵,TRAE出来之后感觉非常香。然后下半年各家推出coding plan,Claude Code + GLM用起来也很爽。目前的开发配置变成了CC+GLM写代码,TRAE读和审代码,组合使用很爽,唯一的痛点就是TRAE目前没有linux版本。
  • OS:今年的一个重要变化是主力OS全面脱离Windows,一方面是把自己的笔记本改用PopOS为主力了,另一方面是把妹子的Macbook M1 Air给薅了过来做半个主力机。不得不说虽然MacOS并不好用,但是M1Air的续航是真的顶,而且手感也是后无来者了。

目前在Macbook Air上装的应用

  • 开发机:今年摆脱昇腾生态,开始学习NV+Arm的生态。买了Jetson Orin和Thor来进一步学习端侧部署工具链的,也买了铭凡R1来学习Arm的生态并尝试搭配LP的刀卡来做日常开发机,不过目前还没搞定,坑还是蛮多的。
  • 穿戴设备:24年年会上抽到了一个华为Watch GT4,本来准备送人但是没送出去,想着旧了不用估计电池就不太行了,于是就直接自己用了哈哈(换掉了之前的小米手环8Pro, which is pretty trash)。用下来对续航还是很满意的,于是又给妹子买了GT5哈哈。然后既然都进了华为生态了,后面又买了一个Freebuds Pro 4给她,对它的音质和降噪也还是挺满意的。目前我个人通勤用的耳机是买了FreeLace Pro 2搭配她淘汰的Galaxy Buds 2使用。
  • NAS:刚回国那会儿给家里买了个绿联NAS DX4600Pro,用着觉得还不错。今年一看绿联系统出第二代了,我自己也需要一个在身边的NAS,于是又买了绿联DXP2800。用下来感觉还是挺好的,debian也可靠,SSH权限也开了可以随便弄,现在基本是可以当作一个家庭服务器使用了~不过坑比的是给家里买的NAS没到两年,今年硬盘阵列直接出问题,四个盘都GG,简直离谱。(原因查了半天绿联也没查出来,我怀疑是SSD读写缓存导致的)好在配套买的希捷硬盘专门提供了数据恢复,大部分关键数据还是找回来了。这也是让我心有余悸,于是今年也把duplicacy的备份流程重新捡了回来。

碎碎念:之前买的Topping G5又鼓包了,拖延症导致一直没处理掉,很烦= =

生活记录

25年显著地比24年要忙不少了,出差也还是很多(于是IHG会员也干到了钻石,亚朵和华住也都金卡),不过还是尽可能地每个假期都充分利用上哈哈:春节@桂林见了老朋友,清明:北京-上海自驾搬家,五一:日本关西游(京都+大阪),十一:马来西亚亚庇+吉隆坡,10月底参加朋友婚礼回桂林一趟,别的就没什么旅行了~今年有抽时间把照片在NAS上好好整理一下,现在手机上能直接等NAS看到自己的相册,非常不错~

京都岚山法轮寺


总结到这,明年再见👋

使用 Hugo 构建
主题 StackedJimmy 设计,Jacob 修改