2024 回顾

又是很久没有写博客了，这次准备写一下2024年的总结。~~本来是打算过年期间写的，但是过年实在是半天都没闲着哈哈~~

我小时候就不爱写日记，长大了也没有写月度、年度总结的习惯。但我想了想，我把这归结为读书时代生活变化还是太少了，但是在工作之后其实明显能感觉到，生活节奏进一步加快，而且事物变化的速度也是陡然增加（无论是由大模型带来的各行各业的改造，还是公司组织变动，都是以往读书时不曾有过的生活轨迹突变）。因此从今年开始，希望以后每年都能写一份年度总结，或长或短，只要年纪大了回头看，能回忆起这些岁月，回想起经历的种种，也就够了~

技术思考

这一年我主要的研究经历都在自动驾驶大模型（LLM、VLM）上，这个话题在年初的时候还比较前沿，那会只有理想一家有论文出来，整体学术界也没有几篇大模型做自动驾驶的文章。但是到了年底，情况就大不一样了。在前几天参加的第四届全球自动驾驶峰会上，不仅有专门的自动驾驶VLM研讨会，在主会场大部分的speaker也都提到的VLM，真是太卷了。。。另外反观学术界，基本上到了下半年已经没有什么有意思的自动驾驶VLM的文章了，是不是说明这个赛道确实学术界很难玩转呢？

不过我想感慨的还不是行业变化太快，而是一年下来，跟进这么多学术和行业热点之后整体大概有以下思考：

Scaling Law：这个词火起来也是很久了，但是在DeepSeek R1这个现象级的事件让我尤其感慨，就是掌握了Scaling Law并不等于商业领先。Scaling Law告诉我们的其实恰恰是，商业/产品比拼的是体系效率。对于AI企业来说，谁的数据管道效率高，算力资源利用的高，谁迭代快，谁就能拿到优势。这可能解释了为什么OpenAI没有能一直保持遥遥领先，因为在没有颠覆式技术创新的情况下，OpenAI相比对手的效率优势并不明显；这也能解释为什么喊着要自研智驾的各家传统车企，真正做出来能用的L2+产品的并不多，可能就在于他们在机器学习范式下的体系效率远远落于新势力。
端到端自动驾驶：端到端并不是未来（参见之前关于端到端博客）。今年一年的探索告诉我，端到端想寻出来一个还行的模型，在现在各家的数据体量下其实并不难，但是端到端仍然无法解决以前用规则难以解决的问题，甚至目前端到端的水准还不如写的好的规则系统，其核心优势仅有类人这一点的。但另一方面，端到端给了以前没什么基础的厂家一个赶超的机会，因为端到端门槛低，需要的工程师少，能看到不少自研智驾，并且起步晚的公司（如理想、长城）都是上来直接奔着端到端做了。不过就像上面说的，尽管做demo很快，但是从demo往上爬做到一个稳定可靠的系统并没有那么容易，华为、蔚来、长城、多家公司的现状都验证了这一点。
具身智能：具身智能今年真是非常火热，智元发了量产产品线，还联合浦江实验室发了个开源数据集 - Agibot-World；宇树的狗在ICRA 2024上疯狂刷脸，并且人形机器人还上了25年春晚；穹彻智能等其他公司也大批获得融资。就连学术界、高校都有明显的往具身转的趋势，我司内部也在搭建新部门，探索相关方向。不过，我还是比较同意苏菁在一次地平线技术分享会上的观点：

可到了今天，坦白讲，凯哥（余凯）是很乐观的，但我已经快抑郁了，因为自动驾驶真的非常难。
我有很多朋友已经改行了，去做了具身智能、机器人。自动驾驶不做了，受不了了。也有不少人问我，要不要去做具身智能？我想，咱们连自动驾驶都搞不定，有什么资格做机器人？
― 苏菁, 2024地平线智驾科技畅想日 / RoboX整理

大家都对通用机器人都趋之若鹜，可能还是因为自动驾驶太卷了吧~

管理思考

今年是我第一次以类似于技术项目经理的角色去带一个团队，虽然团队不大，但是确实是跟以往在学校里团队协作的感觉还是完全不一样的。由于比较新手，还没法特别体系化地去描述管理者这个角色的方方面面，我就把我想到的一些经验和收获零碎地总结一下吧：

新技术的生命周期：早期0-1注重快速demo成型、中期1-10注重基建和重构（重构这件事，早了晚了都不行，很难）、后期10-100注重体系效率。
不同scale的问题管理的重点和难度是不一样的（最简单的例子就是管一个千万人口的国家和管理十亿人口的国家难度是不一样的）。一个项目的不同周期也不一样，干交付和干预研的完全不一样（可以提一下开源中国那篇文章）
突破性技术容易产生在宽松的环境里（欧美在创新上做的突出，还是因为有资本有资源）。当资源充足时可以公司和投资人愿意投人投钱去探索，不用特别push，做0-1。但是落后的有竞争压力的行业和公司，就没办法承担这样的风险。虽然卡的严的规章制度会阻碍部分天才的创新，但是流程的作用是兜住下限，保证整体的组织效率没啥问题；反之，如果希望流程变松变简单，那前提可能就是团队成员的平均水平要足够高。
不同能力的人拉起水平一起干事，是很难的。管理成本随着人力的复杂，会非线性上升。越大的团队，管理成本会高很多。为什么OpenAI、Deepseek只招牛人，可能因为这样管理损耗小，不用卡很严的流程阻碍创新。（我感觉华为本质上确实不是个创新公司，牛还是牛在1-10的过程，而不是0-1的过程。）
作为管理者，给团队成员不仅要给予鼓励，更有必要的是要及时提供负面反馈，让组员意识到哪里做的不好，或者不符合要求。如果平时让他觉得一切安好，但是后面突然暴大雷，这对项目，对管理者，对他自己，都不是好事。要及时纠偏。
项目运作，要重视目标，并且技术项目制定目标要慎重。目标要制定地努努力就能达成，不能太高导致项目风险太大，也不能太低（当然通常是领导要求你不能目标太容易）。当项目目标风险很大时，也要注意及时梳理上游依赖，保证项目的风险是能往上游传导，而不是卡在自己的手上。

工具革新

每年基本上都有新的产品、新的工具流出现，而我这个人又比较喜欢折腾，因此其实每年都应该记录一下各种工具上的变化，这样过几年回来看也能从工具的变化映射出时代的变化~

开发：VSCode -> 内部版VSCode；Miniconda -> Miniforge （源生conda的依赖解析实在是太慢了）；lmdeploy -> 尝试swift
项目管理：记事本 -> 公司内部WeTask -> 尝试学习飞书
LLM Chat：最开始ChatGPT -> 智谱清言 -> 豆包
笔记本：自己的惠普Aero -> 大幅依赖公司的笔记本（Matebook X挺不错，颜值没得喷，就是性能太拉跨）
相机：购入pocket3和A7C2，给朋友买了Insta360 Go3，体验都不错，虽然大部分时间难逃吃灰命运hh
耳机：在美国搭的一套设备都在回国前出掉了，回来之后由于租房不想买大设备，于是购入了HE400s（一直想试试Hifiman的耳机于是买了个便宜的），买了Topping G5（想着弄个体积小的但是也能给主机用的DAC）。G5电池鼓包焕新一次，990咸鱼想出手出不掉。。不过G5的音质还是非常不错的，解析力很好，因此目前还是留在手里了。

生活记录

今年大部分时间都在上班和宅家了，由于既没有车也没有什么娱乐活动，周末要么就是去加班要么就是在家宅着（😓，好像有点读博以来的惯性，工作和生活没有分的特别开。今年另一个值得一提的是，基本每个月都会出差，半自愿的那种哈哈哈。大部分都是去上海找ADS的客户，也有一次去苏州参加四野会战（虽然名字被划进四野了，但是好在最后只集结去苏州了一次），还有一次去深圳出差了大半个月去集中带队参加Carla比赛，一波就住亚朵住到了金卡会员。一年下来飞了十几趟也直接飞出了南航银卡~

今年除了出差之外，打工人也尽量利用了每一个假期：5月 @长沙参加婚礼、10月 @夏威夷爽玩一周、清明 @ 扬州瘦西湖、中秋 @ 眉山、上海周边小游N次（6月@舟山花鸟岛、8月@安吉、@湖州、11月@乌镇、@朱家角、@拙政园、@狮子林、@太湖）。不过由于实在是太懒，那些照片还是先呆在硬盘里吃灰吧😂，等啥时候有Ai自动修图+拼图了再来整理好了哈哈哈，这里就贴一张夏威夷云海的照片吧~

Mauna Kea天文台看日落

年度总结就到这里啦~现在真是忙得找一个写博客的时间都不太有了，还是希望后面最好能做到笔耕不缀吧~