钟元鑫
研究方向:空间智能,多模态大模型,智能网联汽车
教育背景
2018年9月 - 2023年8月 哲学博士, 密歇根大学安娜堡分校 机械工程系
机械工程 (4.0/4.0)
代表课程: 机器人数学 (A+), 强化学习理论 (A+), 高级计算机视觉 (A+), 随机系统 (A)
2014年9月 – 2018年7月 工程学士, 清华大学 车辆与运载学院
车辆工程, 辅修计算机应用 (92/100)
代表课程: 人工智能导论 (100), 数据结构 (95)
工作经历
北京 | 上海,中国
华为诺亚方舟实验室
2023年10月 – 现在
自动驾驶研究团队负责人,华为天才少年计划成员
主导第二代智驾大模型PanguDrive研发(合作团队人数60+):
- 主导华为ADS 5.0系统架构中的大模型设计(ADS 5.0为华为端到端智驾系统ADS 4.0的下一代架构。)
- 主导智驾垂域模态Encoder与对齐模块改进,通过额外模态接入与垂域Encoder融合实现规划能力提升40%以上。
- 参与训推框架与盘古多模态合并重构,主导DP/TP/PP分布式训练下的多源数据链路开发。
- 主导基于商发智驾系统的全自动智驾思维链数据生产管线构建,完成亿级智驾语料输出生产。
- 主导智驾大模型推理能力构建,突破多项思维链数据增强技术,达成智驾大模型推理准确率达到7X%。
- 协助完成智驾大模型系统接入,实车路测MPI逼近端到端,并且在复杂拓扑场景对主线/端到端胜率4X%。
参与第一代智驾大模型研发(合作队伍人数20+):
- 从零到一构建华为智驾大模型训推框架,设计智驾思维链框架,设计智驾难例数据标注规格与文档、主导搭建半自动智驾思维链数据生产平台(挖标产)。
- 参与第一代与第二代智驾大模型评测基准构建,主导其中时空理解与决策规划部分评估系统设计。
- 主导智驾大模型决策能力构建,参与智驾大模型复杂道路要素理解能力构建。实现模型规控能力提升82%,泛化难例决策精度9X%。
- 针对ADS下一代芯片规格限制,通过模型词表改进与推理范式突破,实现7B模型实时推理。
参与端到端自动驾驶系统构建
- 领导跨国团队构建两段式端到端自动驾驶系统,荣获Carla Leaderboard 2.0 Map Track第一。
- 参与华为ADS4.0端到端智驾系统早期设计(感知规控网络中间接口)。
森尼韦尔,美国加利福尼亚州
Apple LLC公司
2022年5月 – 2022年8月
机器学习实习生 ⏐ 由Waleed Abdulla指导
- 研究基于深度学习的图像跟踪算法,提出元学习框架以适应用户自定义图案;优化网络架构,使得算法在移动端高效运行。算法已应用于Vision Pro和iOS ARKit等产品
(远程) 山景城,美国加利福尼亚州
Waymo LLC公司
2021年5月 – 2021年8月
感知算法实习生 ⏐ 由David Lee和Sharon Jin指导
- 基于隐式表达模型开发了车辆与行人形状估计算法。搭建了多套TensorFlow工具,用于数据集生成、模型验证和可视化。
安娜堡,美国密歇根州
密歇根大学 Rackham 研究生院
2018年9月 – 2023年8月
研究生科研助理 ⏐ 师从彭晖教授和刘向宏教授
- 搭建了一套开源全栈无人驾驶平台 - CLAP,并依此完成MCity自动驾驶数据集标定及采集。
- 研究基于体素和隐式表达的点云目标检测与全景分割算法,以及遮挡场景下的动态三维建图与决策算法。
西雅图,美国华盛顿州
华盛顿大学 iUTS实验室
2017年7月 – 2017年9月
访问学生 ⏐ 师从班学刚教授
北京,中国
清华大学车辆与运载学院
2016年9月 – 2018年6月
本科生研究助理 ⏐ 师从杨殿阁教授
- 完全自主地搭建了一套无人驾驶中间系统OpenICV,作为ROS的替代品,已在实验室得到广泛使用。
- 进行相机和激光雷达信息融合算法的研究,提出估计异形标定板姿态的算法Limited-RANSAC。
代表论文
- Real-time Semantic 3D Dense Occupancy Mapping with Efficient Free Space Representations (2022)
Yuanxin Zhong, Huei Peng.
2022 IEEE Conference on Intelligent Transportation Systems (ITSC 2022)
IEEE, arXiv - VIN: Voxel-based Implicit Network for Joint 3D Object Detection and Segmentation for Lidars (2021)
Yuanxin Zhong, Minghan Zhu, Huei Peng
The 32nd British Machine Vision Conference (BMCV 2021)
BMVC, arXiv - CLAP: Cloud-and-Learning-compatible Autonomous driving Platform (2020)
Yuanxin Zhong*, Zhong Cao*, Minghan Zhu, Xinpeng Wang et al.
The 31st IEEE Intelligent Vehicles Symposium (IV20)
IEEE, Github, DOI - Pixels and 3-D Points Alignment Method for the Fusion of Camera and LiDAR Data (2018)
Shichao Xie, Diange Yang, Kun Jiang, Yuanxin Zhong
IEEE Transactions on Instrumentation and Measurement (TIM), 68
IEEE, DOI - Real-time Semantic 3D Dense Occupancy Mapping with Efficient Free Space Representations (2022)
- 一种可高效推理的自动驾驶大模型并行系统 (2024,交局专利)
- 一种基于智驾白盒算法的高效自动化思维链数据生产和应用方法 (2025, 交局专利)
开源项目
- pcl.py : 点云处理库PCL的Cython绑定 C++, Cython | PCL
- xviz.py : 一个Uber xviz协议的Python实现 Python
- dgal : 可微分几何算法库 C++, CUDA
- d3d : 3D机器学习工具包 Cython, CUDA | PyTorch
- Fluss : 无损音乐整理工具 Python | Qt
- CLAP : 兼容云与学习的无人驾驶平台 C++, Python | ROS
- num-prime : 纯Rust实现的数论工具库 Rust
- dashu : 纯Rust实现的一套任意精度数字库 Rust
曾向 SciPy,Pytorch,PytorchLightning,xviz 等项目贡献代码
技术技能
编程语言: C/C++/CUDA, Python/Cython, Rust, C#, MATLAB, Zig, CMake, SQL
程序库: Tensorflow/PyTorch, Huggingface, Megatron, PCL, Eigen, Numpy, …
软件: ROS, Carla, SUMO, AutoCAD, Maya, SolidWorks, V-REP, …
硬件: ST STM32, TI TMS570, NXP K60, …
荣誉奖项
- 华为IAS BU技术突破奖 华为技术有限公司
- 华为天才少年计划第四期 华为技术有限公司
- “科技创新,星火燎原”清华大学学生创新人才培养计划 清华大学
- 学业/科创优秀奖学金 清华大学
- Carla 2024自动驾驶挑战赛 Map Track 第一名 英特尔研究院
- Carla 2019自动驾驶挑战赛 第二名 英特尔研究院
- 第十届智能车大赛 第四名 清华大学
- 第二届TI杯汽车电子大赛 一等奖 清华大学
与我联系
中国上海市青浦区 | 谷歌学术 |