1 基本概念

1.1 精度

半精度浮点数 (Half-precision):16位,

单精度浮点数 (Single-precision):32位,提供约7位有效数字。

双精度浮点数 (Double-precision):64位,提供约15-16位有效数字。

1.2 算力单位

TOPS:指的是每秒钟可以执行的整数运算次数,它代表着计算机在处理图像、音频等任务时的处理能力。TOPS的单位是万亿次每秒(trillion operations per second)。一般是指整数运算能力INT8。亿是10^8,万亿次就是10^12。貌似有些时候T是tera。

TFLOPS:指的是每秒钟可以执行的浮点运算次数,它代表着计算机在处理科学计算、机器学习等任务时的处理能力。TFLOPS的单位是万亿次每秒(trillion floating point operations per second)。一般是指单精度性能FP32

PFLOPS:等于每秒一千万亿10^15次浮点运算。(petaFLOPS)

GFLOPS:等于每秒十亿次10^9浮点运算。(gigaFLOPS)

MFLOPS:等于每秒一百万次浮点运算。(megaFLOPS)

1.3 自动驾驶等级

1.3.1 L0级,无自动驾驶

L0级是指汽车完全没有自动驾驶功能,所有的操作都由驾驶员来掌控,汽车只负责执行。这是最传统的驾驶模式,也是目前大多数汽车的状态。L0级的汽车可能会有一些辅助功能,比如倒车雷达、车身稳定系统等,但这些功能并不属于自动驾驶的范畴,只是提高了驾驶的安全性和便利性。

1.3.2 L1级,辅助驾驶

L1级是指汽车可以辅助驾驶员完成某些驾驶任务,比如配备自适应巡航功能的汽车,可以根据前方车辆的速度和距离,自动调节自己的速度和刹车,保持安全的车距。但是,L1级的汽车并不能同时控制车辆的横向和纵向,也就是说,它不能同时控制方向盘和油门刹车,而且驾驶员必须时刻监管周边情况,随时准备接管车辆。L1级的汽车已经比较普遍了,很多中高端车型都具备了这个功能。

一般都是配备毫米波雷达,判断前方是否有车辆,可以自适应巡航,无法实现自动变道,只能控制车辆的油门和刹车。

1.3.3 L2级,部分自动驾驶

L2级是指汽车可以同时控制车辆的横向和纵向,也就是说,它可以同时控制方向盘和油门刹车,实现自动换道、自动泊车、自动跟车等功能。L2级的汽车的自动驾驶技能比L1级的智能一些,可以帮助驾驶员在高速公路或者城市道路等场景下,更加轻松地驾驶。但是,L2级的汽车并不能应对所有的路况和环境,还需要驾驶员时刻保持注意力,在出现紧急情况时需要随时接管车辆。L2级的汽车也已经比较常见了,很多十万级别的车型都配备了这个功能。

基本上是不能做到:识别道路信号灯。

算力需求:2-2.5TOPS

1.3.4 L3级,条件自动驾驶

L3级是指汽车可以在特定的条件下,自主地完成全部的动态驾驶任务,比如在高速公路上,汽车可以自动识别路标、限速、障碍物等,自动调整车速、变道、超车等,不需要驾驶员的干预。但是,L3级的汽车并不能适应所有的场景和环境,当汽车遇到复杂的情况,或者超出了自动驾驶的设计范围时,它会提醒驾驶员接管车辆,如果驾驶员没有及时响应,汽车会自动减速停车。L3级的汽车目前还没有大规模的商业化,只有少数的车型在部分地区进行了试运行,比如奥迪A8在德国的高速公路上,可以实现L3级的自动驾驶。

算力需求:20-30TOPS

1.3.5 L4级,高度自动驾驶

L4级是指汽车可以在大部分的场景和环境下,自主地完成全部的动态驾驶任务,不需要驾驶员的监督或者干预,也不需要驾驶员随时准备接管车辆。L4级的汽车可以根据导航、路况、天气等信息,自动规划路线,自动处理各种复杂的情况,比如红绿灯、人行横道、路口、施工等。L4级的汽车可以适应多种场景,比如城市道路、高速路、乡村路等,但是可能还不能覆盖所有的场景,比如极端的天气、恶劣的路况等。

算力需求:200TOPS以上

1.3.6 L5级,完全自动驾驶

L5级是指汽车可以在任何场景和环境下,无需驾驶员的存在,完全自主地完成全部的动态驾驶任务,也就是所谓的无人驾驶。L5级的汽车可以适应任何的路况、天气、交通规则等,不需要任何的人工干预或者控制,也不需要任何的驾驶设备,比如方向盘、油门刹车等。L5级的汽车是自动驾驶的终极目标,也是最难实现的,目前还没有任何公司或者机构能够达到这个水平,也没有任何的法律法规能够支持这种模式的运行。

算力需求:L5级别算力需求更是超过2000TOPS。

2 常见芯片的算力

Jetson、GeForce、RK3588都有专门的编解码单元,这部分是用来独立编解码视频的,不会占用GPU算力。

比如GeFore和Jetson有NVDECNVENCNVJPEG单元。

alt text

比如RK3588的VPU单元。

alt text

2.1 Jetson Nano

alt text

2.2 Jetson Xavier

alt text

2.3 Jetson Orin

alt text

2.4 NVIDIA 30系列显卡

alt text

2.5 NVIDIA 40系列显卡

alt text

2.6 RK3588

alt text

补充

特斯拉目前的FSD 3.0芯片,算力大概是 144 TOPS

参考

参考1:NVIDIA显卡比较

参考2:Jetson比较