恐怕是中国发展最快的自动驾驶企业吧。
日前结束的“毫末智行Q3品牌日”上,业界评价为“中国最熟悉自动驾驶量产”的该公司发布了最新成绩单。
增收快,成立不到两年的毫末智行,今年实现了亿单位的销售额。
这本身就很不可思议。
《2001》在今年第二季度一口气推出了10款量产产品。在硬件、软件方面,最新产品都是与“阿里达摩院”合作的无人末端配送车“小蛮驴”。
而且,技术的重复也很快。
从今年1月开始,不是模拟,中国在实际道路上的行驶里程超过100万公里。
这个惊人的进展情况,智行先生到底有什么呢
每个人都有高管登场,分享技术细节,“全部坦白”家传技艺。
我拿到了100万公里的数据,但问题不是那嚒简单。首先,能知行的100万公里是从哪里来的呢。
毫末智行孵化于长城汽车集团,诞生于这家传统汽车巨头的自我忧患中,担负起长城智能化变形的核心重任。
今年推出的魏牌摩卡车型是毫米智能驾驶系统的首秀。
但是,即使你得到了1000万公里的数据,发现问题也并不容易。
在品牌日的现场,百度无人车队CEO顾维灏从问题入手,透露了一点点成绩单背后的努力和探索。
首先,在庞大的数据中,提高驾驶辅助系统能力所需的数据并不多。
例如,在一个城市的高速公路影像中,60%以上可能是没有突发事件的平坦路段。
无论有多少这样的数字,都无法决定性地提高系统的能力。
倒不如说,出现频率低、目标小的图像数据才是弥补系统弱点的关键。
我们的第一个任务就是找出这些有价值的数据
[2003]此外,在价值映像中,模型能力不足会导致严重的小目标漏检,从而降低数据利用率。
另外,在模型能力方面,也存在着即使能够识别白色轿车,也无法识别植物中隐藏的白色轿车的“数据偏差问题”。
这两个问题发生在数据收集的前一阶段。
在获得了经过处理的有价值的数据之后,系统将致力于其他的课题。
一是如何快速迭代,更简单地说,如何在调整后加快新模型的训练。
另一方面,大量数据的传入会使模型版本快速迭代,因此,如何在短时间内验证这些不同的模型也面临不少挑战。
自动驾驶公司因为没有数据而感到为难,但像这样数据和场景不缺的企业,面临着另一个维度的问题。
刚才,在第3次的品牌日,CEO顾维灏首次明确了详细的对应法。
对自动驾驶的批量生产说「最详细」的该公司,找到在开发过程中的问题点,如何解决那个成为品牌日的重要的点。
从对应这样的课题的技术的提案,也能明白该公司对自动驾驶的量产化最详细的理由。
“变大变小”的数据诊断,首先从找到有价值的场景数据开始,并将其称为诊断。
目前诊断手段有两种。
第一种方法是通过明确的系统故障信号获得诊断结果。例如,通过人接管信号。
也就是说用户在使用中发现并接管系统能力的不足,分析和学习系统在接管前后时间内的取数据上传的场景库。
第二种方法是使用更强大的后服务端模型来诊断车端模型的错误。
车端模型计算,传输延迟,参数有限,初始能力自然不足有限,一般一个小模型负责感知部分任务。
因此,我们通过实测发现,对于来自偏远地区的小目标,以前的版本发生了漏检。
部署在服务端的大型模型称为功能模型,是基于变换器的任务识别大型模型
计算力要求高,资源占有,但能力超强,发现小模型会错过错误,或在恶劣天气下识别能力下降的错误。
▲上面是车端模型的检查遗漏,下面是大型模型的检查遗漏
找到问题后,将结果返回模型并重新学习,以最大限度地捕捉有效数据。
如果你找到了一个存在“闻一知十”数据偏差消除问题的场景,你需要补充该场景所需的足够样本数据。
你可以把它调出来,制作出更好的AI模型
通过已经推出的《长城魏摩卡》,积累了大量道路场景数据库。
面对大量场景,毫米方法首先采用无教师学习的方法将图像矢量化,将图像数据转换为特征向量,然后根据光谱簇将相似的图像聚在一起。
获得聚类结果后,对于所需的场景,可以将同一类别的相关数据作为正样本,找到大量相似且容易混合的另一类别的数据作为负样本。
另外,在类中,只拾取类中心和类边界附近的数据,提高了标记的效率。
它还非常有效地将不同来源的数据以适当的方式混合在一起,从而提高最终模型的效果。
数据诊断是“大和小”,与此相对,“数据偏差”是通过听一知十的方法来解决的。
在训练的同时,将炼丹时间缩短一半,得到了提高模型能力的关键数据,接下来是“炼丹”。
虽然Transformer的能力很强,但是训练的速度也很慢。
在360GB RAM、4个V100GPU服务器上,标准数据并行DDP培训也需要100多小时。
如果毫米工程师稍微改变网络配置和参数配置,或者交换数据,重复一次查看结果的周期将接近100小时。
但是,由于这些工作频繁发生,这将显著延缓技术迭代。
为此,除了一般数据的并行化之外,还需要更精致的模型的并行化。
首先是数据并行化,在各GPU上训练网络,配合GPU将数据分块。每个层的坡度都会与其他GPU交互,这样可以更快地收敛模型,并在较少的环境中获得相同的训练效果。
这种数据并行和模型并行的混合方式称为流并行
swin-transformer采用流并行方式,整体实现了50-80%的高速化。
生产线测试场景的训练效率提高,带来了新的问题:
模型迭代快,版本多,如何验证其有效性
当然,在模拟环境中测试模型是主流,但传统的模拟是一种非常低效的方法。
从场景设计,设置道路模型,设置车辆模型,设置交通流模型,到最后进行模拟测试…每人每天只能做30个。
所以毫米末开发了语义场景自动化转化工具和参数的广义工具,可以将CSS中的场景库描述文本自动转化为仿真测试场景并且在适当的范围内离散采样得到巨大量的模拟测试用例。
同时通过在云上并行化,现在每天自动生成1万多个模拟测试案例。
简单来说,刚才的数据诊断是数据标记自动化,而云上的语义方案自动化是在管道中生产测试方案的工具。
天下武功,无难攻不落之坚,只是快而不破。
自动驾驶也是智行最清楚的。
数据又大又多,处理又快又准确,以此为基础,产生了不可思议的量产速度。
公司内部称董事长张凯、CEO顾维灏为测试狂,每周都会花很多时间自己测试智能驾驶产品。
在品牌日现场,董事长张凯也提到,长城汽车内部更注重智能化,每周六要求技术负责人,各公司高管一定要参加智能化体验测试。
不仅是本公司的产品,对市场上销售的所有产品进行比较,有时魏先生自己也会参加。
表现出完全的硬核技术的颜色。
此外,张凯表示,规模以量的速度最为重要,自动驾驶公司到2022年找不到大规模落地路径,无疑是致命的。
到底是什么样的公司呢
加快速度和磨练技术是完全相同的脉络,不矛盾。
Transformer喜欢什么在上个月的特斯拉AI日上,马斯克首次透露了DOJO,并与Transformer分享了大型型号自动驾驶的角色。
事实上,这种想法在中国已经得到实践。
在Q3品牌日,我们发现Transformer是一个重要的开发工具。
其实,毫末智行CEO顾维灏,第一次在公开场合登场的时候,表明着对Transformer的特别的关心。
之后也在公开场合多次提及。
顾维灏自动运行行业的现状是传感器供应商,认为方案相同,仅通过硬件栈是不会拉开差距的。
所以未来的决胜点一定在数据上,数据多是前提,数据好是基础。
如果经常关注AI技术前沿,那么Transformer首先是进行语言处理任务,具有避免循环的模型结构,完全依赖注意力机制来建模输入输出的全局依赖关系。
也就是说,只要数据足够大,就可以训练出巨大的模型。
近两年,Transformer图像识别的准确率、效率和鲁棒性不断更新各种排名,形成一对一的较量。
这是一个真正强大的奇迹,因为这个方法要求一个巨大的数据集,正好是毫米末智行的数据收集,泛化的优势和完美的match。
为什么自动驾驶要在云层上决一胜负。对于毫米末智行自研计算力平台ICU3.0,顾维灏目前有观点认为,车端计算力已经达到几个T,完全够用。
但是,从实践中得出了完全不同的结论。
仅从相机来看,今天的汽车主流相机还是100万像素,而搭载毫米末智能驾驶系统的长城车型,将开始使用200万像素和800万像素相机。
因此,长城汽车、毫米末智行联合高通,推出目前世界上计算力最高的可量产自动驾驶计算平台ICU3.0(即毫米末智行“小魔箱3.0”),平台单板计算力达到360TOPS,可升级至1440TOPS。
但在未来,车端一个摄像头的数据量可能是100倍,车端用摄像头的数量也可能是十几倍。
从这一点来看,车载计算芯片的计算能力再增加几百倍也不够。
因此,大数据量带来了巨大的计算量,只有云才能解决。
前面提到的服务(云)端大模式训练车端小模式,核心逻辑就在这里。
Q3品牌全体日,毫米智行
文章评论