gpt需要算力(GPT需要算力吗)
大家好!今天让创意岭的小编来大家介绍下关于gpt需要算力的问题,以下是小编对此问题的归纳整理,让我们一起来看看吧。
开始之前先推荐一个非常厉害的Ai人工智能工具,一键生成原创文章、方案、文案、工作计划、工作报告、论文、代码、作文、做题和对话答疑等等
只需要输入关键词,就能返回你想要的内容,有小程序、在线网页版、PC客户端和批量生成器
问友Ai官网:https://ai.de1919.com。
本文目录:
DriveGPT落地后,卷激光雷达和算力会变得毫无意义?
席卷自动驾驶行业的寒冬还没有过去,开发周期长、成本高,又难落地的问题并没有完全被解决,而大量的车企都在激进的进行电动化和智能化的转型,自动驾驶的研发又是绕不开的重要一部分。
可是靠自动驾驶技术和故事去吸引消费者的路线已经逐渐走不通了,比亚迪王传福也站出来炮轰自动驾驶,让自动驾驶的寒意更浓了。
其实自动驾驶难落地的问题,对于谁都一样,谁都绕不过去这个问题,但是车企和自动驾驶企业们可以在“开发周期和成本”方面开卷,因为在大环境不利的情况下,谁能用更低的成本和更高的效率坚持并维持住,才可能在春暖花开之时迎来绽放。
自动驾驶寒冬之下,靠AI真能降成本?在本周的在第八届毫末AI DAY上,毫末智行发布了首个应用GPT模型和技术逻辑的自动驾驶算法模型DriveGPT,并正式官宣中文名为“雪湖·海若”。DriveGPT首发车型是即将量产上市的全新摩卡DHT-PHEV,有了DriveGPT之后,自动驾驶开发中的周期和成本都会大幅缩短和降低。
目前的自动驾驶技术发展情况,主流的自动驾驶训练方式主要有两种:真实道路测试和虚拟仿真测试。
真实道路测试最大的特点是能够与真实交通环境相匹配,模拟真实生活中的各种复杂情况。同时,真实道路测试还可以发现一些不常见或难以预测的情况,提高自动驾驶系统的适应性和可靠性。然而,真实道路测试需要大量的时间和金钱投入,同时还涉及交通安全、法律法规以及人员伤害等问题,给测试过程带来了一定的风险和压力。这些都会导致测试成本的增加。
另一种方式就是虚拟仿真测试,它是在计算机模拟环境下测试自动驾驶系统,通过虚拟场景来训练模型。虚拟仿真测试可以避免真实道路测试中的安全问题和成本压力,同时还可以快速生成大量的数据,提高测试效率和数据量,而且在其中已经辅以了不少AI人工智能技术。
但是,虚拟仿真测试中的数据和场景是人为设计的,可能无法完全反映真实道路的复杂性和不确定性。因此,虚拟仿真测试有时需要进行一定程度的真实道路测试来验证其结果。
DriveGPT采用了与ChatGPT一样的Transformer模型与RLHF人类反馈学习能力,通过引入真实驾驶场景和人驾接管数据,可对自动驾驶认知决策模型进行持续优化,从而为自动驾驶开发降低成本。
由于DriveGPT是在虚拟仿真环境下进行训练的,因此可以省去真实道路测试中的安全问题和成本压力。DriveGPT能够生成大量的仿真数据用于训练模型,这些数据能够很好地模拟真实道路的复杂性和不确定性,从而保证模型的鲁棒性和可靠性。同时,在仿真环境下进行训练还可以大大节约时间和成本。
15天就能完成1年的任务量,还能“赚外快”?与传统的真实道路测试相比,DriveGPT能够快速高效地获取大量数据。DriveGPT的训练过程是完全自动化的,不受测试时间、环境等因素的影响,从而大大提高了测试效率和数据量。这不仅节约了训练时间,还可以提高模型的精度和鲁棒性。
DriveGPT自身能区分驾驶场景和非驾驶场景,并可以理解驾驶环境,还可用于场景识别标注任务,比如标注车道线、交通参与者、红绿灯、路牌等细节信息,并且每张图的识别优化价格从约 5 元下降到 0.5 元,成本下降了近10倍,在OpenAI的GPT-4出来的时候,它的识图能力引起了我们的高度关注,而与其底层类似的DriveGPT,已经把这项能力用了起来。
AI自动识图逐渐开始代替人工,人工标注的效率和成本是绕不过的问题,机器不需要休息,也几乎不会眼花,而自动标注的成本仅是过去使用人工的十分之一不到,而且半个月就能完成人力一年的需求。
DriveGPT使用大量的仿真数据来训练模型,这些数据能够很好地反映真实道路的复杂性和不确定性,DriveGPT它能够更好地处理自然语言、图像等多种数据类型,还可以去自行学习,从而提高模型的复杂性和准确性。
另外在产品迭代方面,DriveGPT能够为自动驾驶开发者提供快速有效的反馈,帮助它们更快地调试和优化系统,从而进一步降低系统迭代方面的开发成本。
通过DriveGPT训练出来的模型可以转移到真实道路测试中进行验证,进一步提高了系统的安全性和可靠性。DriveGPT训练出来的模型能够很好地反映真实道路的复杂性和不确定性,从而在真实道路测试中能够更快地适应各种情况,DriveGPT还可以同时让系统处于多个平行宇宙之中,也就是提前做好再一次遇到类似情况可能发生的各种驾驶情况,在预测人车轨迹能力上也得到了大幅提升。
DriveGPT的能力不只局限于自动驾驶领域内,我们看到毫末的合作伙伴还有北京交通大学计算机与信息技术学院、火山引擎、华为云、京东科技、高通、四维图新、英特尔等,当然这里面有很多是供应商伙伴,但四维图新这个伙伴,可能是DriveGPT要去赋能的另外一部分。
此次四维图新也官宣表示:接入毫末DriveGPT雪湖·海若,可实现持续双向赋能。借助DriveGPT雪湖·海若算法能力可提升地图成图自动化水平。DriveGPT对于图像强大的理解能力,可以应用于地图测绘方面,DriveGPT可以使用AI大模型来进行对物体的识别,特别是建筑物,具体来说,它可以通过大量的地图数据和卫星影像数据进行训练,然后利用这些数据来识别、分类和标注建筑物信息。同时,由于DriveGPT使用的是AI技术,因此其识别准确率和效率都比传统的人工测绘方法更高。
除了建筑物识别,DriveGPT还可以用于其他地图测绘任务,例如道路标注、地形分析、地图更新等,特别是随着搭载DriveGPT的车型越来越多,它们甚至可以去试试生成鲜度比较高的高精地图,虽然毫末打造的是重感知、轻地图的系统,DriveGPT也是为了去加深这一目的,但是高精地图可以给到供应商去做别的事情,并不是只有自动驾驶需要高精地图。
总结:与传统的自动驾驶训练方式相比,DriveGPT能够省去真实道路测试中的安全问题和成本压力,同时能够高效快速地获取大量数据、精准地反映真实道路的复杂性和不确定性、提供快速有效的反馈以及能够转移到真实道路测试中进行验证等优点。毫末接下来的辅助驾驶方案,可能会把软硬件的成本卷得更低。
DriveGPT具有很大的应用前景,虽然我们看到目前只看到了毫末智行入局GPT类自动驾驶,但其他车企和供应商们肯定不会放过这个机会,AI技术大爆发的当下,或许比DriveGPT更高阶的自动驾驶训练方式也在来的路上。
而且随着AI的全面接入,再靠堆硬件,比激光雷达数量、摄像头像素和个数、算力芯片能力,可能不再是吃香的办法,没人愿意为能力低,而靠堆硬件带来的高成本而买单。
【本文来自易车号作者路咖汽车,版权归作者所有,任何形式转载请联系作者。内容仅代表作者观点,与易车无关】
gpt4电脑配置
目前还没有官方发布关于GPT-4的具体电脑配置要求。不过根据GPT-3的配置要求,GPT-4可能需要更高的计算能力和存储要求。预计推荐的配置应该包括以下部分:CPU:至少Intel Core i7或AMD Ryzen 7或更高
GPU:Nvidia V100或AMD MI100或更高
内存:至少64GB RAM
存储器:至少2TB的SSD硬盘
操作系统:至少Windows 10或Ubuntu 18.04或更高
备注:以上配置只是预估,可能会因GPT-4的进一步发展和实际需求而变化,具体需求以官方公布为准。
当GPT遇到自动驾驶,毫末首发DriveGPT
GPT之于自动驾驶意味着什么?
文丨智驾网 黄华丹
ChatGPT带火了AI,那么,当GPT遇到自动驾驶,又会发生怎样的化学反应?
GPT全称Generative Pre-trained Transformer,即生成式预训练Transformer。简单概括即是一种基于互联网可用数据训练的文本生成深度学习模型。
4月11日,在第八届毫末AI DAY上,毫末CEO顾维灏正式发布了基于GPT技术的DriveGPT,中文名雪湖·海若。
DriveGPT能做到什么?又是如何构建的?顾维灏在AI DAY上都做了详细解读。此外,AI DAY还展示了毫末自动驾驶数据体系MANA的升级情况,主要是其在视觉感知能力上的进展。
01.
什么是DriveGPT?能实现什么?
顾维灏首先讲解了GPT的原理,生成式预训练Transformer模型本质上是在求解下一个词出现的概率,每一次调用都是从概率分布中抽样并生成一个词,这样不断地循环,就能生成一连串的字符,用于各种下游任务。
以中文自然语言为例,单字或单词就是Token,中文的Token词表有5万个左右。把Token输入到模型,输出就是下一个字词的概率,这种概率分布体现的是语言中的知识和逻辑,大模型在输出下一个字词时就是根据语言知识和逻辑进行推理的结果,就像根据一部侦探小说的复杂线索来推理凶手是谁。
而作为适用于自动驾驶训练的大模型,DriveGPT雪湖·海若三个能力:
1.可以按概率生成很多个这样的场景序列,每个场景都是一个全局的场景,每个场景序列都是未来有可能发生的一种实际情况。
2.是在所有场景序列都产生的情况下,能把场景中最关注的自车行为轨迹给量化出来,也就是生成场景的同时,便会产生自车未来的轨迹信息。
3.有了这段轨迹之后,DriveGPT雪湖·海若还能在生成场景序列、轨迹的同时,输出整个决策逻辑链。
也就是说,利用DriveGPT雪湖·海若,在一个统一的生成式框架下,就能做到将规划、决策与推理等多个任务全部完成。
具体来看,DriveGPT雪湖·海若的设计是将场景Token化,毫末将其称为Drive Language。
Drive Language将驾驶空间进行离散化处理,每一个Token都表征场景的一小部分。目前毫末拥有50万个左右的Token词表空间。如果输入一连串过去已经发生的场景Token序列,模型就可以根据历史,生成未来所有可能的场景。
也就是说,DriveGPT雪湖·海若同样像是一部推理机器,告诉它过去发生了什么,它就能按概率推理出未来的多个可能。
一连串Token拼在一起就是一个完整的驾驶场景时间序列,包括了未来某个时刻整个交通环境的状态以及自车的状态。
有了Drive Language,就可以对DriveGPT进行训练了。
毫末对DriveGPT的训练过程首先是根据驾驶数据以及之前定义的驾驶尝试做一个大规模的预训练。
然后,通过在使用过程中接管或者不接管的场景,对预训练的结果进行打分和排序,训练反馈模型。也就是说利用正确的人类开法来替代错误的自动驾驶开法。
后续就是用强化学习的思路不断优化迭代模型。
在预训练模型上,毫末采用Decode-only结构的GPT模型,每一个Token用于描述某时刻的场景状态,包括障碍物的状态、自车状态、车道线情况等等。
目前,毫末的预训练模型拥有1200亿个参数,使用4000万量产车的驾驶数据,本身就能够对各种场景做生成式任务。
这些生成结果会按照人类偏好进行调优,在安全、高效、舒适等维度上做出取舍。同时,毫末会用部分经过筛选的人类接管数据,大概5万个Clips去做反馈模型的训练,不断优化预训练模型。
在输出决策逻辑链时,DriveGPT雪湖·海若利用了prompt提示语技术。输入端给到模型一个提示,告诉它“要去哪、慢一点还是快一点、并且让它一步步推理”,经过这种提示后,它就会朝着期望的方向去生成结果,并且每个结果都带有决策逻辑链。每个结果也会有未来出现的可能性。这样我们就可以选择未来出现可能性最大,最有逻辑的链条驾驶策略。
可以用一个形象的示例来解释DriveGPT雪湖·海若的推理能力。假设提示模型要“抵达某个目标点”,DriveGPT雪湖·海若会生成很多个可能的开法,有的激进,会连续变道超车,快速抵达目标点,有的稳重,跟车行驶到终点。这时如果提示语里没有其他额外指示,DriveGPT雪湖·海若就会按照反馈训练时的调优效果,最终给到一个更符合大部分人驾驶偏好的效果。
02.
实现DriveGPT毫末做了什么?
首先,DriveGPT雪湖·海若的训练和落地,离不开算力的支持。
今年1月,毫末就和火山引擎共同发布了其自建智算中心,毫末雪湖·绿洲MANA OASIS。OASIS的算力高达67亿亿次/秒,存储带宽2T/秒,通信带宽达到800G/秒。
当然,光有算力还不够,还需要训练和推理框架的支持。因此,毫末也做了以下三方面的升级。
一是训练稳定性的保障和升级。
大模型训练是一个十分艰巨的任务,随着数据规模、集群规模、训练时间的数量级增长,系统稳定性方面微小的问题也会被无限放大,如果不加处理,训练任务就会经常出错导致非正常中断,浪费前期投入的大量资源。
毫末在大模型训练框架的基础上,与火山引擎共同建立了全套训练保障框架,通过训练保障框架,毫末实现了异常任务分钟级捕获和恢复能力,可以保证千卡任务连续训练数月没有任何非正常中断,有效地保障了DriveGPT雪湖·海若大模型训练的稳定性。
二是弹性调度资源的升级。
毫末拥有量产车带来的海量真实数据,可自动化的利用回传数据不断的学习真实世界。由于每天不同时段回传的数据量差异巨大,需要训练平台具备弹性调度能力,自适应数据规模大小。
毫末将增量学习技术推广到大模型训练,构建了一个大模型持续学习系统,研发了任务级弹性伸缩调度器,分钟级调度资源,集群计算资源利用率达到95%。
三是吞吐效率的升级。
在训练效率上,毫末在Transformer的大矩阵计算上,通过对内外循环的数据拆分、尽量保持数据在SRAM中来提升计算的效率。在传统的训练框架中,算子流程很长,毫末通过引入火山引擎提供的Lego算之库实现算子融合,使端到端吞吐提升84%。
有了算力和这三方面的升级,毫末可对DriveGPT雪湖·海若进行更好的训练迭代升级。
03.
MANA大升级,摄像头代替超声波雷达
毫末在2021年12月的第四届AI DAY上发布自动驾驶数据智能体系MANA,经过一年多时间的应用迭代,现在MANA迎来了全面的升级。
据顾维灏介绍,本次升级主要包括:
1.感知和认知相关大模型能力统一整合到DriveGPT。
2.计算基础服务针对大模型训练在参数规模、稳定性和效率方面做了专项优化,并集成到OASIS当中。
3.增加了使用NeRF技术的数据合成服务,降低Corner Case数据的获取成本。
4.针对多种芯片和多种车型的快速交付难题,优化了异构部署工具和车型适配工具。
前文我们已经详细介绍了DriveGPT相关的内容,以下主要来看MANA在视觉感知上的进展。
顾维灏表示,视觉感知任务的核心目的都是恢复真实世界的动静态信息和纹理分布。因此毫末对视觉自监督大模型做了一次架构升级,将预测环境的三维结构,速度场和纹理分布融合到一个训练目标里面,使其能从容应对各种具体任务。目前毫末视觉自监督大模型的数据集超过400万Clips,感知性能提升20%。
在泊车场景下,毫末做到了用鱼眼相机纯视觉测距达到泊车要求,可做到在15米范围内达测量精度30cm,2米内精度高于10cm。用纯视觉代替超声波雷达,进一步降低整体方案的成本。
此外,在纯视觉三维重建方面,通过视觉自监督大模型技术,毫末不依赖激光雷达,就能将收集的大量量产回传视频转化为可用于BEV模型训练的带3D标注的真值数据。
通过对NeRF的升级,毫末表示可以做到重建误差小于10
【本文来自易车号作者智驾网,版权归作者所有,任何形式转载请联系作者。内容仅代表作者观点,与易车无关】
以上就是关于gpt需要算力相关问题的回答。希望能帮到你,如有更多相关问题,您也可以联系我们的客服进行咨询,客服也会为您讲解更多精彩的知识和内容。
推荐阅读:
ChatGPT中国免费网页版(ChatGPT中国免费网页版)