GPT创始人是谁
大家好!今天让创意岭的小编来大家介绍下关于GPT创始人是谁的问题,以下是小编对此问题的归纳整理,让我们一起来看看吧。
开始之前先推荐一个非常厉害的Ai人工智能工具,一键生成原创文章、方案、文案、工作计划、工作报告、论文、代码、作文、做题和对话答疑等等
只需要输入关键词,就能返回你想要的内容,有小程序、在线网页版、PC客户端和批量生成器
本文目录:
为什么是毫末智行成为了DriveGPT的破壁人?
作者 | 魏启扬
来源 | 洞见新研社
毫末智行有着天生的紧迫感。
很多科技公司一年才举办一次的品牌日活动,毫末智行硬是办成了一个季度一次,活动频次的提高,则意味着组织内部新陈代谢的提速,从研发到落地乃至运营,都要跟上步点节奏。
毫末智行用这样一种方式来鞭策自己在自动驾驶道路上的进取之心。
4月11日结束的第八届HAOMO AI DAY,活动规格再上台阶,吸引了中国汽车芯片联盟联席理事长、中国电动汽车百人会副理事长董扬,同济大学教授、汽车安全技术研究所所长朱西产,清华大学车辆与运载学院教授曹东璞、华为云人工智能领域首席科学家、国际欧亚科学院院士、IEEE/CAAI Fellow田奇等业内大咖参会。
在影响力持续扩大的同时,毫末智行再次更新了自己在技术、产品和生态上的进展,其中城市NOH即将量产上车与毫末DriveGPT 雪湖·海若的发布成最大亮点。
前者是中国首个重感知、不依赖高精地图的城市NOH,将最先落地北京、上海、保定等城市,后者则是全球首个自动驾驶生成式大模型。
NOH量产上车,毫末智行过去就曾做过预告,此次确定了更具体的落地时间,算是兑现了之前“夸下的海口”。
至于雪湖·海若 ,在GPT火热的当下,参与其中的自动驾驶公司也不少,为什么是毫末智行率先发布,成为很多人心中的谜团。
01 自动驾驶大考年,毫末智行冲在最前线毫末智行加快推进NOH的落地进程,很大一部分原因在于智驾产品已经进入到全线爆发的前夜。
来自工信部和高工智能汽车研究院的数据显示,2021年乘用车L2级智驾产品的搭载率是23.5%,全年共交付了476万辆。
到了2022年,乘用车上车的智驾产品升级到L2级以上,搭载率提升到29.4%,全年了交付了585.99万辆。
按照这一趋势预测,到2025年时,乘用车L2级以上智驾产品的搭载率将达到70%。
毫无疑问,正在经历的2023年和还没到来的2024年将十分关键,用毫末智行董事长张凯的话来说,“2023年既是自动驾驶的冲刺之年,也是大考之年”。
张凯判断,智驾产品今年的爆发将主要集中在两个方面。
第一个是城市导航辅助驾驶产品将围绕量产上车发力,主要玩家的城市辅助驾驶产品进入到真实用户覆盖和多城市落地的比拼。
另一个是行泊一体和无人车商业化将成为自动驾驶公司深耕的重点。在乘用车领域,搭载行泊一体功能的智驾产品将迎来前装量产潮。
事实上,毫末智行作为“渐进派”的代表,坚定认为辅助驾驶是通往自动驾驶的必由之路,因而在过往,一直致力于推动智驾产品上车。
2021年推出HPilot 1.0版本,当年即完成坦克300城市版、魏牌拿铁、魏牌玛奇朵、哈弗神兽5款车型的量产上车,搭载乘用车数量超过数万台。
2022年,毫末智行对HPilot进行了两次大版本更新,HPilot月度搭载增速超过200%,与此同时,毫末城市NOH辅助驾驶系统也完成了量产交付,搭载HPilot 3.0的新摩卡DHT-PHEV魏牌蓝山将在2023年先后上市。
根据毫末智行官方公布的数据,截至目前,毫末HPilot整体已搭载近20款车型。用户辅助驾驶行驶里程突破4000万公里,HPilot 2.0 辅助驾驶日均里程使用率达到了12.6%。
NOH的推进方面,目前已经在北京、保定、上海等城市开启泛化测试,即将量产上车,毫末智行预测,到2024年,城市NOH将有序落地100城,届时,毫末辅助驾驶乘用车总量也将来到百万量级别。
有业内人士评述,即便按照当前的节奏不变,毫末智行智驾产品量产落地的速度也已与友商拉开了差距,至少领先行业一年以上。
毫末智行的”快”主要体现在两个方面,一个是产品的推新和迭代速度快,一个是由量产落地而带动的规模覆盖。
不得不说毫末智行选择了一条最为“稳妥”的自动驾驶路线。
在应对行业竞争,推动自动驾驶落地的过程中,我们很清晰的看到,HPilot、城市NOH等智驾产品正在源源不断的为毫末智行提供营收,而随着这些智驾产品的每一次迭代升级,自动驾驶能力一点点的向上提升,毫末智行距离全无人驾驶的星辰大海也更近了。
除了自动驾驶量产上车之外,毫末智行还公布6P开放合作的进展,目前已与3家主机厂签署定点合同,相关项目正在交付中。
在此之前,行业对毫末智行发展潜力存疑的主要观点是过于依赖长城,如今6P合作实现突破,表示毫末智行开始走出长城,迈向更广阔的发展空间,构建属于自己的“长城”。
02 数据“第一性原理”,DriveGPT雪湖·海若的主要支撑点将ChatGPT与DriveGPT雪湖·海若进行对比,虽然都是GPT,但运行条件和应用场景还是有很大的不同。
ChatGPT是对话式的生成式自然语言模型,输入是自然语言的文本串,输出就是自然语言的文本,目前ChatGPT主要完成通用的下游语言生成任务,比如多轮对话、代码生成、翻译、数学运算等。
DriveGPT雪湖·海若是用于自动驾驶场景的生成式大模型,输入是感知融合后的文本序列,输出是自动驾驶场景文本序列,即将自动驾驶场景Token化,形成“Drive Language”,最终完成自车的决策规控、障碍物预测以及决策逻辑链的输出等任务。
DriveGPT雪湖·海若的实现过程是,首先在预训练阶段通过引入量产驾驶数据,训练初始模型,再通过引入驾驶接管Clips数据完成反馈模型(Reward Model)的训练,然后再通过强化学习的方式,使用反馈模型去不断优化迭代初始模型,形成对自动驾驶认知决策模型的持续优化。
毫末智行CEO顾维灏在自动驾驶技术领域的眼光独到,布局非常领先。
早在 2021 年,毫末智行就已经开始了 Transformer 大模型技术的探索,并快速落地应用到 BEV 视觉感知算法当中,然后又以五大模型的方式来实现自动驾驶感知、认知算法的快速升级,现在这些大模型将统一到 DriveGPT 生成式大模型当中,最终目标是实现端到端自动驾驶。
很明显,和ChatGPT一样,DriveGPT雪湖·海若的技术原理并不复杂,但为何是毫末智行抢到了落地的头炮呢?
因为要想获得理想的训练结果,必须具备两个条件,海量的数据和超强的算力,而这恰恰是毫末智行区别于其他自动驾驶公司的优势长板。
先看数据。
去年9月的第6届HAOMO AI DAY上,CEO顾维灏向外界确认,毫末智行正式进入数据驱动的自动驾驶 3.0 时代。
如何理解?毫末智行依托HPilot的量产,目前已经积累了超过4000万公里辅助驾驶里程的数据,就场景来看,包括城市道路、城市快速路和高速;就数据分类来看,既有真实的感知数据,也包含真实的人驾数据。
毫末智行的数据优势并不是数据量的多少,而是获取数据的能力。
以HPilot为代表的智驾产品一直在持续的大规模量产上车,这也是说,毫末智行拥有稳定且优质的数据源,这些数据被投喂到MANA数据智能体系的训练中,推动MANA的进化成长,从而完成数据在其设计的技术架构内的闭环。
截至到2023年4月,MANA学习时长超56万小时,虚拟驾龄相当于人类司机6.8万年。
再来看看算力。
毫末智行很早就预见了算力对于自动驾驶研发的重要性,与特斯拉建设超算中心Dojo类似,毫末智行今年1月发布了中国自动驾驶行业最大的智算中心MANA OASIS(雪湖·绿洲),算力达67亿亿次/秒。
通过一系列的训练框架、性能、通信等优化,MANA OASIS可单机实现训练100亿参数规模的大模型的能力,同时执行多任务、多模态并行的训练,大幅提升计算效率。
为了支持DriveGPT雪湖·海若的训练,毫末智行还对MANA OASIS在算力层面进行三大能力的升级。
1、搭建了“全套大模型训练保障框架”,实现了异常任务分钟级捕获和恢复能力,可以保证千卡任务连续训练数个月没有任何非正常中断,有效保证了大模型训练稳定性;
2、研发出以真实数据回传为核心的增量学习技术,并将其推广到大模型训练,构建了一个大模型持续学习系统,自主研发任务级弹性伸缩调度器,分钟级调度资源,集群计算资源利用率达到95%;
3、MANA OASIS通过提升数据吞吐量来降本增效,满足Transformer大模型训练效率,通过引入火山引擎提供的Lego算子库实现算子融合,端到端吞吐提升84%。
古希腊哲学家亚里士多德曾提出过“第一性原理”的哲学术语,翻译过来就是,“每个系统中存在一个最基本的命题,它不能被违背或删除。”
从毫末智行所表现出来的技术理念来看,无论是走“渐进式”路线,还是建设算力基础设施MANA OASIS,围绕的中心都是数据,在毫末智行的认知中,数据就是自动驾驶的“第一性原理”,基于此,毫末智行构建起行业竞争的护城河。
03 从毫末到雪湖再到海诺,自动驾驶的中国式浪漫在DriveGPT雪湖·海若发布之外,另外一个值得关注的点是,毫末智行还对外开放了该模型。
北京交通大学计算机与信息技术学院、高通、火山引擎、华为云、京东科技、四维图新、魏牌新能源、英特尔等单位成为首批合作伙伴。
此外,毫末智行在使用数据的过程中,还建立了一套极具性价比的,基于4D Clips数据的自动化标注方案。
目前,一张正确标注结果的图片在行业中的市场价是5块钱,如果使用DriveGPT的标注服务,这个价格将只需5毛钱。
毫末智行计划,这项图像帧及4D Clips自动标注服务将逐步向行业开放使用。
很明显,毫末智行发布DriveGPT雪湖·海若,并不是炒作跟风,而是真真切切的在做自动驾驶研发,更难能可贵的是,毫末智行很多前沿技术不光是为自己所用,还将其开放出来,以生态共建的形式,为行业的发展添砖加瓦。
其实,从毫末智行公司名字的由来,到自动驾驶智算体系MANA雪湖的命名,再到DriveGPT雪湖·海若的来源,能够窥视出毫末智行在自动驾驶这件事情上一以贯之的企业价值观。
“毫末”二字取自道家学派创始人老子之《老子·第六十四章》:“合抱之木,生于毫末。九层之台,起于累土。千里之行,始于足下。”强调的是一点一滴积累、脚踏实地耕耘的重要性。
“雪湖”这一名称,出自科幻小说《三体》第二部《黑暗森林》,说的是主人公罗辑在星空、雪山、森林、草地和湖畔之间徜徉思考,直到有一天在湖中寻找到了绿色“三体危机”、拯救地球的方法。
将其延伸,“雪湖”这个名字代表了毫末对人类社会和科技趋势发展的热情,承载着毫末以AI通向自动驾驶梦想的思考。
“海若”则出自《庄子·秋水》,里面有两个神话人物河伯和北海若。河伯请教北海若,何谓大小之分,北海若教导,不因天地而觉大,不因毫末而觉小。其中蕴含着智慧包容、海纳百川的寓意。
将上述命名来源进行梳理,可以发现毫末智行的企业价值观融汇了中国古代经典的道家思想和科幻巨作天马行空式的哲学思辨,再结合当前正在从事的最前沿的自动驾驶事业,毫末智行呈现出特立独行的气质,更宏观的视角,还能看到一种与众不同的中国式浪漫。
【本文来自易车号作者洞见新研社,版权归作者所有,任何形式转载请联系作者。内容仅代表作者观点,与易车无关】
月薪5000美元的CEO?来看看他的打工日记
撰文 / 张霖郁
编辑 / 张 南
设计 / 琚 佳
来源 / The New York Times,作者:Cade Metz
在美国,ChatGPT(或称GPT-3.5)不是唯一的基于大语言模型的AI产品,它的对手包括谷歌开发的Bard等其他产品,Bard在3月已开始小范围测试。
纽约时报科技记者科德·梅茨(Cade Metz)受邀体验了这款产品,给出的结论是Bard比GPT-3.5或GPT-4.0更为谨慎。
科德对人工智能相关技术的报道超过十年,他曾出版过一本书,里面报道了AI界的天才。
2019年夏天,他接到山姆·阿尔特曼(Sam Altman)的邀请,也就是今天被称为“ChatGPT之父”的山姆,当时他刚拿到微软的10亿美元投资合同。他俩在旧金山附近的一家具有现代风格的小餐馆吃了顿晚饭,山姆住这附近。
吃饭间隙,他举起手机,向科德展示了与微软刚签完的合同,里面阐述了微软将投资10亿美元,目的是帮助OpenAI构建通用人工智能(Artificial General Intelligence)。
山姆一边喝着甜酒,一边描述着OpenAI的计划。
OpenAI在那一年刚从非营利组织转为营利性组织,山姆从Combinator Y辞去总裁一职,到这家成立仅4年的公司亲自任职CEO,也是在这一年,他和捐款人马斯克(Elon Musk)闹掰,大概是因为机构性质变动或微软的注资,但两人的矛盾当时并没有公开。他们的恩怨请阅读《马斯克拉黑了OpenAI》
直到近两周,马斯克主动在推特上提及,他们之间的这段纷争才曝光。有意思的是,一个月前,马斯克还接受了山姆的采访,采访地点在特斯拉工厂,两人讨论了年轻人如何创业的话题。
2019年的那一晚,山姆把OpenAI开发的产品影响力比作,他谈论时好像在聊家长里短一样地轻松,但当时OpenAI公司还不到100人,大家还都不知道微软之后接下来的钱要从哪里凑。
科德坐在山姆对面,感觉在听一部科幻小说。
当时,山姆告诉科德,OpenAI在开发的产品可能会给世界带来繁荣和财富,同时,也可能会让很多人失业,摧毁这个世界。
“我不知道自己做的是好事还是坏事”,山姆说。
抵制
从去年第四季度ChatGPT的发布到今年GPT-4的上市,不同的声音同时出现。
美国未来生命研究所(Future of Life Institute)在3月发布了公开信,并有1000多位人工智能专家和技术领袖签名,呼吁OpenAI和其他公司暂停ChatGPT等系统上的工作,停止训练比GPT-4更强大的AI系统,暂停时间至少6个月。他们认为对“社会和人类构成很大风险”。呼吁的人中包括马斯克。
3月31日,意大利个人数据保护局以涉嫌违反数据收集规则为由,对OpenAI展开调查,并宣布禁止使用ChatGPT,且暂时限制OpenAI处理意大利用户数据。
意大利个人数据保护局禁令的理由是:“没有任何法律依据表明,为了‘训练’平台运营背后的算法而大规模收集和存储个人数据是正当的。”该监管机构还指责OpenAI未能有效识别用户年龄,根据OpenAI条款,ChatGPT的用户必须年满13岁。
当地时间4月5日,在与意大利个人数据保护局的视频会议上,OpenAI承诺将在处理用户和验证用户年龄的方式上更加透明。山姆参加了这次会议。他们在4月6日向意大利个人数据保护局提交一份关于补救措施的文件,之后意大利数据保护局将评估这一方案。
在我国,百度的文心一言已经发布,更多的互联网大厂或是初创企业正在飞速进入这一赛道,数据安全同样是令人关心的话题。
关于GPT-4
和GPT-3.5相比,GPT-4的主要优势在于它对自然语言的掌握已经非常娴熟,你不会觉得是在和机器对话。
OpenAI在旧金山的办公室▼
它不仅可以生成流畅和连贯的文本,还可以以各种方式理解和处理文本,如总结、翻译或回答一系列极其广泛的问题。此外,这里所说的翻译不仅是指不同自然语言之间的翻译,还包括语气和风格的翻译,以及跨领域的翻译,如医学、法律、会计、计算机编程、音乐等等。这些技能清楚地表明,GPT-4能够理解复杂的思想。
许多人可能会疑惑,GPT-4是否真正理解了所有这些概念,或者它是否只是在即兴发挥方面比以前的模型好得多,而没有任何真正深刻的理解。
OpenAI对于“真正深刻的理解”唯一的测试手段,就是看它能否产生新的知识,比如证明新的数学定理,而这一能力目前对大语言模型来说仍遥不可及。
GPT-4在需要推理他人心理状态的现实场景中表现优于ChatGPT(GPT-3.5),并且在社会环境中会为共同目标提出合作行动。GPT-4具有非常高级的心智理论水平。
虽然ChatGPT在基本测试中也表现良好,但似乎GPT-4更加心思细腻,能够更好地推理多个行动者,以及各种行动如何影响他们的心理状态,特别是在更现实的场景中。
简单理解,GPT-4比ChatGPT更像人。
一部分行业领导者、人工智能研究员以及权威人士将 GPT 视为一项根本性的技术转变,与网络浏览器或 iPhone 的发明同等重要,但他们之间的分歧主要在于这项技术的未来形态以及应用场景,而另一部分人极力反对,这1000多位科学家以及权威人士充分表达了他们的担忧。
以一当十
“对于当下ChatGPT的炒作短期来看不在我们的掌控范围,已经完全失控了,但长期我们希望是朝着对的方向发展。”山姆告诉科德,总会有一个阶段,大家会明白这些产品将如何改变世界。
山姆今年37岁,看起来有一点孩子气,尤其在和马斯克的对谈中更为明显。2019年上任OpenAI的CEO,他对科德说自己并没有占任何股份,他在OpenAI是拿薪水,每年65000元美金,满足上社保的要求。
山姆生长在圣路易斯,他在2000年进入了当地的预科学校约翰·巴勒斯 (John Burroughs School),这是一间私立学校,以19世纪美国哲学家约翰·巴勒斯名字命名。
他非常能说服人。当时教计算机课程的老师认为山姆除了在计算机方面表现出的才华之外,他还能带领同学开拓新方向的能力。
“他有创造力和远见,加上雄心壮志和人格力量,可以说服其他人与他合作,将他的想法付诸实践”,这位老师告诉科德。
格雷厄姆(Paul Graham)也有同样的评价,格雷厄姆是山姆的导师,同时也是Y Combinator的创始人。
两人2005 年认识,当时山姆申请了 Y Combinator 的第一批初创企业名额。他是第一个获得名额的,包括 10,000 美元的种子资金,当时他在斯坦福上大二,之后退学创办了自己的新公司 Loopt,这是一家社交媒体初创公司,可以让人们与朋友和家人分享他们的位置。
“他天生就有说服人的能力。”格雷厄姆说,“如果这不是天生的,至少在他20 岁前他就已经完全掌握了这一能力。我第一次见到 山姆是在他 19 岁时,我当时觉得他很像比尔·盖茨。”
山姆正是凭借他的说服力在2018年底前后在爱达荷州太阳谷举行的技术领袖年度聚会上单枪匹马说服了微软首席执行官萨提亚·纳德拉(Satya Nadella)以及微软首席技术官凯文·斯科特(Kevin Scott),最终他们谈判达成协议。
山姆现在说,在斯坦福的短暂停留期间,他从玩扑克的许多夜晚中学到的东西比他从大多数其他大学活动中学到的还要多,扑克教会了他如何读懂人和评估风险。
他之后出售了Loopt,获得微薄回报后,便以兼职合伙人身份加入了 Y Combinator。三年后,格雷厄姆辞去公司总裁一职,任命了仅28 岁的山姆为继任者。
对立和统一
山姆并不是程序员、工程师或人工智能的研究人员。
他更多扮演的是制定目标、议程,将团队聚集在一起并实现交易的人。在他出任 “YC”的总裁后,他启动了一个新的投资基金和一个新的研究实验室,并将每年提供咨询的公司数量增加到数百家。
在此期间,他还开始投资公司以外的几个项目,包括 OpenAI。最终他决心把精力集中在一个项目上,而他相信这一项目将对世界产生真正的影响。他曾考虑过政治,但最终选择了人工智能。
OpenAI员工在咖啡间办公▼
据他的弟弟马克斯(Max Altman)说,他相信自己是少数可以通过人工智能研究改变世界的人之一。
与此同时,山姆是一个生活在矛盾中的人,就像他从事的人工智能具有两面极端的属性。
周一到周五,他住在旧金山市中心,周末,他和自己的伴侣奥利弗·穆赫林 (Oliver Mulherin),一位澳洲的软件工程师,两人住到加州的一个牧场,那里有农场工人种葡萄酿葡萄酒,并且养奶牛。
但山姆是一位素食者,养奶牛这件事让人觉得奇怪,但他说:“奥利弗喜欢。”
这是一个安静的农场,位于布满青草的岩石和山丘之间。他们改造了已有25 年历史的房子,外表看起来既朴实又现代,覆盖外墙的钢已完全生锈。
山姆就在市中心和郊野之间居住,也在素食者的饮食却同时被肉制品包围的环境中生活。
科德觉得他是硅谷的产物。
在 2010 年代中期迅速成长,欣喜若狂。2014 年至 2019 年,作为YC的总裁,为层出不穷的新公司提供建议,他足够精明,也亲自投资了几家家喻户晓的公司,包括 Airbnb、Reddit和Stripe。
他认识到一项技术在何时将达到指数级增长,然后顺着曲线走向未来。
在他到硅谷的同一时间,人工智能就存在着争议。他一边和团队推进人工智能,而同时也清醒地意识到这一科技带来的致命杀伤力。
他并不一定受金钱驱动。在OpenAI 65000美元的年薪并不能致富,他之前通过YC投资的项目产生一部分收入。
格雷厄姆说:“有些人赚到足够的钱之后就停止了,但山姆似乎对钱的兴趣度不是特别大。另一种可能是,他从事OpenAI的原因或许是更喜欢权力。”
在加州农场的湖边,科德问山姆,一台模拟人脑的机器是否最终会把人类劳动的价值降为零时,他并不同意,他说无法想象这个世界人类智慧有一天会毫无用处。
注:本文参考了orange ai翻译的《GPT-4 ,通用人工智能的火花》论文
本文由汽车商业评论原创出品
转载或内容合作请联系说明
违规转载必究
【本文来自易车号作者汽车商业评论,版权归作者所有,任何形式转载请联系作者。内容仅代表作者观点,与易车无关】
向外突围,毫末开启商业化新故事
终于拿到长城体系外订单
“我们还在等他们(毫末)的车交付之后,才能做技术上的对标。” 同为量产高阶智驾方案的某车企工程师这样评价毫末。
这一对标将在今年初见分销。
4月11日,在第八届AI DAY上,毫末发布了一个堪比BEV的新技术:自动驾驶生成式大模型DriveGPT——雪湖·海若。
2021年特斯拉用一个BEV架构模型搞定了自动驾驶的感知,而雪湖·海若Transformer则有望用一个模型解决自动驾驶的认知问题。
雪湖·海若将依次搭载在魏牌摩卡DHT-PHEV和蓝山上,首批落地在北京、保定、上海等城市,并于2024年开拓100个城市。
此外,毫末宣布与三家主机厂签订了定点合作协议,其中包括长城体系外的品牌。
新技术范式、百城大战,毫末的“野心”要如何实现?
01
一次解决所有问题
“(雪湖·海若)使我们在一个统一的生成式框架下,将规划、决策和推理等多个任务全部完成。”毫末智行CEO顾维灏在采访中表示:“(雪湖·海若)在更大数据的支持下,还是会让(自动驾驶系统的决策能力)有一个质的提升。这一新技术范式即使放眼全球也是非常独特和创新的。”
认知架构雪湖·海若和感知架构BEV一样,旨在通过一个大模型一次性解决问题。
在BEV之前,自动驾驶系统的感知是在各传感器端先进行感知,之后由多个小模型算法进行置信判断和融合之后,输出最终的感知结果。BEV则是一次性“吸收”所有传感器的原始数据,之后直接输出车辆周围360°的完整空间感知结果。
决策方面,目前业内主要包括预测、规划、控制几个环节:
基于感知结果,通过搜索等方法划定出可行使空间,再在其中根据自车和其它交通参与者可能的行动轨迹进行路线规划,最终决定出一条行驶路线,并将行驶路线分解为车辆动作命令传给执行器。
雪湖·海若则是基于感知结果,直接给出规划控制结果和理由:
一次性生成多个未来可能发生的全局场景,并且按照可能发生的概率排序;生成自车未来的轨迹信息;直接给出决策逻辑链。
例如在一个包含对向来车、左侧电动车、右侧过路行人的无保护左转的场景中:
传统方法是先对与自车最有可能交互的对向来车进行轨迹预测,基于预测结果判断自车应该的行驶轨迹。此轨迹如果涉及到电动车/行人等其它的交通参与者,则加入考虑后预测,再判断轨迹,如此往复。
但雪湖·海若是一次性看到路面的全局情况,基于预训练积累的“经验”,直接得出:对向来车已出线刹车概率低、电动车虽然未出线但惯于抢行、行人在路口通常谨慎行动变。如以安全为先,应当缓慢起步,让行电动车后,快速通过路口。
之所以出现这样不同的“思考”方式,在于传统方法和雪湖·海若在短期数据和长期知识上存在不同。
短期数据即当时当刻的路面情况。
由于目前决策大都使用参数有限的小模型,因此一次性能考虑的对象便相对有限。
雪湖·海若作为大模型,在云端参数高达1200亿个,由此在学习时能够做到全局思考。目前毫末未透露部署到车端时的参数规模。
长期知识则是交通规则和常识性的潜规则。
目前主流决策层算法仍以逻辑判断为主,对于“谁会如何”更多还是出自工程师经验。
雪湖·海若则是先在4000万量产车驾驶数据中进行学习,又用5万个经过筛选的人类接管数据做反馈训练,最终习得开车的知识和常识,能够更加类人的,根据当前交通情况推理出未来各类交通场景以及出现的概率。
对于神经网络作为黑盒,思考过程的不可解释化,毫末技术负责人艾锐向《赛博汽车》表示,通过添加限定规则,可以一定程度上解决这一问题。
在决策层引入GPT模型只是开始,未来毫末计划将雪湖·海若扩大为端到端的自动驾驶系统模型,即用一个大模型解决感知、认知的所有问题。
中国自动驾驶逻辑芯片企业地平线也持类似的观点。前不久,地平线作为第一作者发布了基于Transformer的自动驾驶端到端算法框架论文,首次将检测、跟踪、预测、箭头轨迹预测等多个模块用一个完整神经网络架构完整解决。
“让我们有可能像ChatGPT那样,用端到端的大规模的数据去训练整个的自动驾驶系统。”地平线创始人&CEO余凯在演讲中表示。
02
万事俱备,只待上车
一次解决所有问题,当然很棒,但却鲜少有玩家实践该技术。
在2022年的AI DAY和今年的投资者日上,特斯拉展示的预测算法仍是以蒙特卡洛树搜索为主。
小鹏汽车自动驾驶副总裁吴新宙则在4月明确表示,未来小鹏将在预测层面引入神经网络,但在规控层面,仍将以逻辑算法为主。“我对团队有一个明确的线,能用数学方法解决的问题,都先用数学的方法。”
事实上,即使想要应用,GPT也不是普通玩家玩得起的。
华为云人工智能领域首席科学家田奇在近日的演讲中表示,大模型开发和训练一次需要1200万美元。而且并不只是“钱”的事。
首先,雪湖·海若作为GPT(Generative Pre-trained Transformer)生成式预训练大模型,需要有大规模语料库来进行训练。
顾维灏在演讲中表示,雪湖·海若的一个关键设计是将场景Token(令牌,代表执行某些操作的权利对象)化表达:将驾驶空间进行离散化处理,每一个Token都表征场景的一小部分。如果输入一连串过去已经发生的场景Token序列,模型可生成未来所有可能的场景。目前毫末Token的词表空间是50万个左右。
大模型还需要超算中心来训练。
1月,毫末发布了670PFLOPS算力的超算中心——雪湖·绿洲。若按照一块19.5TFLOPS算力的英伟达A100计算,则绿洲或用了34.3万块英伟达A100。
绿洲还针对海若进行了针对性的升级改造。
一是建立全套训练保障框架,避免因个别服务器异常可能导致的训练中端;二是升级弹性调度资源的能力,使训练平台能够自适应每天回传数据不同的大小规模;三是吞吐效率的升级,通过算子融合端到端吞吐提升84%。
但就像ChatGPT和GPT4仍依赖于对话者不断调整问题问法,扩大数据库调用权限,才能表现得更加真实类人一样。
雪湖·海若要做到真正高速类人,在并行效率、算力需求、功耗等方面超过搜索等传统方法,甚至超过人类表现的前提,是源源不断的真实道路场景和人类反馈。
03
毫末的身份突围
2022年底,小鹏、华为、毫末三家抢跑城市领航功能落地。
从结果来看,小鹏、华为都已有了搭载城市领航功能的车队上路,毫末HPilot 3.0所搭载的新摩卡DHT-PHEV预计将于本月推出,而魏牌蓝山要到三季度才会推出激光雷达版。
与此同时,后来者也正逐步逼近,蔚来、理想等车企,和轻舟智航等智能驾驶供应商都已宣布了2024年落地高速、城市领航功能的计划。
之所以形成这样的局面,与毫末的身份不无关系。
毫末虽然出身长城,却无法像蔚小理的智驾团队一样,拥有自上而下的话语权,更多还是相对独立的供应商身份。
但背靠长城又使毫末的供应商身份不那么纯粹。对于出自ICT行业的华为,车企都尚且顾忌灵魂。出自同行的毫末作为供应商,自然也少不了被挑剔。
如何实现身份突围?
今年年初,毫末推出了包括全栈解决方案、云端服务、硬件、软件、模块、原型代码六个层面的6P开放合作模式。合作伙伴不仅可以获取毫末的功能产品,甚至可以获得原型代码这样的底层技术能力。
“您的灵魂您保留,我的灵魂您带走。” 毫末智行COO侯军表示:“(智能/自动驾驶)全栈自研是高成本、长周期的事情。毫末的6P开放模式帮助主机厂在不具备技术和时间的情况下参与竞争。
如果之后毫末的综合性价比能力赶不上合作伙伴进步的灵魂,我们被淘汰也是正常的。如果能赶上,我们愿意与合作伙伴长期携手同行。”
这样“白盒”开放的态度已经起到了效果,毫末已与三家主机厂签署定点合同,其中包括长城体系外的品牌。
在毫末的生态伙伴当中,除了高通这样的老朋友外,还多了英伟达、华为、地平线这样新朋友,未来合作方向值得玩味。
此外,毫末在2024年的百城计划也绝非说说而已。
目前,华为、小鹏的城市领航功能在核心区域仍需依靠高精地图。而毫末的方案则完全不采用高精地图,只用类似导航地图的标清地图,以感知信息的置信权重远高于地图信息,即所谓重感知轻地图方案。
要完全依靠感知信息做判断使毫末目前的城市领航功能更显保守,安全性要求远高于舒适和通行效率。
但由于完全不依赖高精地图,所以毫末HPilot 3.0的开城将不受地图资源限制,随着其感知能力打磨得愈发完善,开城速度也将愈发加速。
顾维灏在演讲中表示,毫末的视觉自监督大模型感知性能已提升20%。例如鱼眼摄像头在15米范围内的测量精度已达到30厘米,2米内精度可以高于10厘米。因此毫末正考虑取消超声波雷达,直接使用鱼眼镜头做泊车功能。
技术进步也正成为毫末作为供应商,持续降本的底气所在。毫末智行张凯表示:“未来(降本同效的策略)对我们和行业发展,都会有很好的推动作用。”
【本文来自易车号作者赛博汽车,版权归作者所有,任何形式转载请联系作者。内容仅代表作者观点,与易车无关】
gpt是谁的
gpt是OpenAI的。根据中国教育科研信息网得知,GPT是由美国人工智能研究公司OpenAI研制的产品。该产品是一种人工智能技术驱动的自然语言处理工具,能够通过学习和理解人类的语言来进行对话,真正像人类一样来聊天交流,甚至能完成文案等;它是一种自回归语言模型,这种模型利用深度学习产生类似于人类语言的文本。以上就是关于GPT创始人是谁相关问题的回答。希望能帮到你,如有更多相关问题,您也可以联系我们的客服进行咨询,客服也会为您讲解更多精彩的知识和内容。
推荐阅读: