人工智能训练模型(人工智能训练模型过程)
大家好!今天让创意岭的小编来大家介绍下关于人工智能训练模型的问题,以下是小编对此问题的归纳整理,让我们一起来看看吧。
ChatGPT国内免费在线使用,一键生成原创文章、方案、文案、工作计划、工作报告、论文、代码、作文、做题和对话答疑等等
只需要输入关键词,就能返回你想要的内容,越精准,写出的就越详细,有微信小程序端、在线网页版、PC客户端
本文目录:
一、AI人工智能-CNN概念轻松入门
假设给定一张图(可能是字母X或者字母O),通过CNN即可识别出是X还是O,如下图所示,那怎么做到的呢
如果采用经典的神经网络模型,则需要读取整幅图像作为神经网络模型的输入(即全连接的方式),当图像的尺寸越大时,其连接的参数将变得很多,从而导致计算量非常大。
而我们人类对外界的认知一般是从局部到全局,先对局部有感知的认识,再逐步对全体有认知,这是人类的认识模式。在图像中的空间联系也是类似,局部范围内的像素之间联系较为紧密,而距离较远的像素则相关性较弱。因而,每个神经元其实没有必要对全局图像进行感知,只需要对局部进行感知,然后在更高层将局部的信息综合起来就得到了全局的信息。这种模式就是卷积神经网络中降低参数数目的重要神器:局部感受野。
如果字母X、字母O是固定不变的,那么最简单的方式就是图像之间的像素一一比对就行,但在现实生活中,字体都有着各个形态上的变化(例如手写文字识别),例如平移、缩放、旋转、微变形等等,如下图所示:
我们的目标是对于各种形态变化的X和O,都能通过CNN准确地识别出来,这就涉及到应该如何有效地提取特征,作为识别的关键因子。
回想前面讲到的“局部感受野”模式,对于CNN来说,它是一小块一小块地来进行比对,在两幅图像中大致相同的位置找到一些粗糙的特征(小块图像)进行匹配,相比起传统的整幅图逐一比对的方式,CNN的这种小块匹配方式能够更好的比较两幅图像之间的相似性。如下图:
以字母X为例,可以提取出三个重要特征(两个交叉线、一个对角线),如下图所示:
假如以像素值"1"代表白色,像素值"-1"代表黑色,则字母X的三个重要特征如下:
那么这些特征又是怎么进行匹配计算呢?(不要跟我说是像素进行一一匹配的,汗!)
这时就要请出今天的重要嘉宾:卷积。那什么是卷积呢,不急,下面慢慢道来。
当给定一张新图时,CNN并不能准确地知道这些特征到底要匹配原图的哪些部分,所以它会在原图中把每一个可能的位置都进行尝试,相当于把这个feature(特征)变成了一个过滤器。这个用来匹配的过程就被称为卷积操作,这也是卷积神经网络名字的由来。
卷积的操作如下图所示:
是不是很像把毛巾沿着对角卷起来,下图形象地说明了为什么叫「卷」积
在本案例中,要计算一个feature(特征)和其在原图上对应的某一小块的结果,只需将两个小块内对应位置的像素值进行乘法运算,然后将整个小块内乘法运算的结果累加起来,最后再除以小块内像素点总个数即可(注:也可不除以总个数的)。
如果两个像素点都是白色(值均为1),那么1 1 = 1,如果均为黑色,那么(-1) (-1) = 1,也就是说,每一对能够匹配上的像素,其相乘结果为1。类似地,任何不匹配的像素相乘结果为-1。具体过程如下(第一个、第二个……、最后一个像素的匹配结果):
根据卷积的计算方式,第一块特征匹配后的卷积计算如下,结果为1
对于其它位置的匹配,也是类似(例如中间部分的匹配)
计算之后的卷积如下
以此类推,对三个特征图像不断地重复着上述过程,通过每一个feature(特征)的卷积操作,会得到一个新的二维数组,称之为feature map。其中的值,越接近1表示对应位置和feature的匹配越完整,越是接近-1,表示对应位置和feature的反面匹配越完整,而值接近0的表示对应位置没有任何匹配或者说没有什么关联。如下图所示:
可以看出,当图像尺寸增大时,其内部的加法、乘法和除法操作的次数会增加得很快,每一个filter的大小和filter的数目呈线性增长。由于有这么多因素的影响,很容易使得计算量变得相当庞大。
为了有效地减少计算量,CNN使用的另一个有效的工具被称为“池化(Pooling)”。池化就是将输入图像进行缩小,减少像素信息,只保留重要信息。
池化的操作也很简单,通常情况下,池化区域是2 2大小,然后按一定规则转换成相应的值,例如取这个池化区域内的最大值(max-pooling)、平均值(mean-pooling)等,以这个值作为结果的像素值。
下图显示了左上角2 2池化区域的max-pooling结果,取该区域的最大值max(0.77,-0.11,-0.11,1.00),作为池化后的结果,如下图:
池化区域往左,第二小块取大值max(0.11,0.33,-0.11,0.33),作为池化后的结果,如下图:
其它区域也是类似,取区域内的最大值作为池化后的结果,最后经过池化后,结果如下:
对所有的feature map执行同样的操作,结果如下:
最大池化(max-pooling)保留了每一小块内的最大值,也就是相当于保留了这一块最佳的匹配结果(因为值越接近1表示匹配越好)。也就是说,它不会具体关注窗口内到底是哪一个地方匹配了,而只关注是不是有某个地方匹配上了。
通过加入池化层,图像缩小了,能很大程度上减少计算量,降低机器负载。
常用的激活函数有sigmoid、tanh、relu等等,前两者sigmoid/tanh比较常见于全连接层,后者ReLU常见于卷积层。
回顾一下前面讲的感知机,感知机在接收到各个输入,然后进行求和,再经过激活函数后输出。激活函数的作用是用来加入非线性因素,把卷积层输出结果做非线性映射。
在卷积神经网络中,激活函数一般使用ReLU(The Rectified Linear Unit,修正线性单元),它的特点是收敛快,求梯度简单。计算公式也很简单,max(0,T),即对于输入的负值,输出全为0,对于正值,则原样输出。
下面看一下本案例的ReLU激活函数操作过程:
第一个值,取max(0,0.77),结果为0.77,如下图
第二个值,取max(0,-0.11),结果为0,如下图
以此类推,经过ReLU激活函数后,结果如下:
对所有的feature map执行ReLU激活函数操作,结果如下:
通过将上面所提到的卷积、激活函数、池化组合在一起,就变成下图:
通过加大网络的深度,增加更多的层,就得到了深度神经网络,如下图:
全连接层在整个卷积神经网络中起到“分类器”的作用,即通过卷积、激活函数、池化等深度网络后,再经过全连接层对结果进行识别分类。
首先将经过卷积、激活函数、池化的深度网络后的结果串起来,如下图所示:
由于神经网络是属于监督学习,在模型训练时,根据训练样本对模型进行训练,从而得到全连接层的权重(如预测字母X的所有连接的权重)
在利用该模型进行结果识别时,根据刚才提到的模型训练得出来的权重,以及经过前面的卷积、激活函数、池化等深度网络计算出来的结果,进行加权求和,得到各个结果的预测值,然后取值最大的作为识别的结果(如下图,最后计算出来字母X的识别值为0.92,字母O的识别值为0.51,则结果判定为X)
上述这个过程定义的操作为”全连接层“(Fully connected layers),全连接层也可以有多个,如下图:
将以上所有结果串起来后,就形成了一个“卷积神经网络”(CNN)结构,如下图所示:
综述:卷积神经网络主要由两部分组成,一部分是特征提取(卷积、激活函数、池化),另一部分是分类识别(全连接层),著名的手写文字识别卷积神经网络结构图:
CNN进化历史:
卷积神经网络(CNN)近年来取得了长足的发展,是深度学习中的一颗耀眼明珠。CNN不仅能用来对图像进行分类,还在图像分割(目标检测)任务中有着广泛的应用。CNN已经成为了图像分类的黄金标准,一直在不断的发展和改进。
CNN的起点是神经认知机模型,此时已经出现了卷积结构,经典的LeNet诞生于1998年。然而之后CNN的锋芒开始被SVM等模型盖过。随着ReLU、dropout的提出,以及GPU和大数据带来的历史机遇,CNN在2012年迎来了历史突破:AlexNet。随后几年,CNN呈现爆发式发展,各种CNN模型涌现出来。
CNN的主要演进方向如下:
1、网络结构加深
2、加强卷积功能
3、从分类到检测
4、新增功能模块
下图是CNN几个经典模型(AlexNet、VGG、NIN、GoogLeNet、ResNet)的对比图,可见网络层次越来越深、结构越来越复杂,当然模型效果也是越来越好:
二、街道垃圾识别系统的原理是什么?
不久前上海关于垃圾分类的出台政策大家应该还记得,做好垃圾分类成为了许多人的难题。其实,随着人工智能技术的突飞猛进,自动分类垃圾桶已经出现了。目前有许多关于人工智能自动分类垃圾的应用,像是芬兰的Bin-e垃圾桶,阿里的“浣熊”智能垃圾分类系统等等,相信国内人工智能自动分类垃圾应用将成为新的发展趋势,人工智能自动分类垃圾的普及也只是时间问题。下面来看看人工智能自动分类垃圾的应用原理。

人工智能可以应用于垃圾分类吗?
在不久的将来,人工智能垃圾桶将更广泛地应用开来,让垃圾分类变得更简单、更高效。今年7月,上海第二批人工智能应用场景需求正式“发榜”,“人工智能在生活垃圾分类中的应用”便是其中之一。根据相关场景需求内容,未来的智能垃圾箱房,可以进行生活垃圾图像采集和识别,智能提示投放分类垃圾桶,当居民投放错误时可立即发现并报警,对湿垃圾中的典型干垃圾杂质进行警报提醒,可识别的杂质类型还可通过智能学习逐步增加。
在生活垃圾分类清运方面,不同种类的生活垃圾清运车可自动识别分类垃圾桶,并进行收运,确保分类收运。通过车载摄像和图像传感设备,记录小区湿垃圾的收集过程,在湿垃圾倾倒入车时,进行杂质识别并记录报警。在垃圾处理中转站,自动分类机器人或智能抓斗,可通过机械手抓取各种形状的垃圾,识别可回收垃圾、有害垃圾等,并放置到不同的回收处理装置中。通过图像识别技术,对中转入集装的垃圾,判别垃圾批次质量,预防之前的漏检以及危险物品。不仅如此,对于部分人群不便定时定点投放垃圾的问题,居民可以通过APP下发指令,GPS垃圾回收机器人接到命令后,启用自身的GPS和运动传感器前往定位住户的指定地点,帮助居民将垃圾自动投放到不同的垃圾桶内。
人工智能自动分类垃圾的应用案例:
波兰创业公司开发了一种基于人工智能和云服务的智能垃圾桶,可以自行判断出垃圾种类并分类。通过传感器、摄像头、具有深度学习特点的AI图像识别算法,来自动分类垃圾。Bin-e垃圾桶用起来特别简单,用户只需在Bin-e垃圾桶前扫描一下垃圾、舱门便会打开,将垃圾放入其中便可以了。其实,垃圾桶早已分辨出垃圾类型,将其压缩并分类放置。另外,垃圾桶的内容、剩余空间都会即时上传到云空间,而回收公司只需要通过App即可随时检查,当然也可收到通知信息。除了回收垃圾,Bin-e垃圾桶甚至还能够通过垃圾分析附近用户的消费习惯(当然是非实名的方式),包括饮料、食品的品牌和数量,对于一些经营商业广场的商业用户来说,显然是具有一定价值
阿里人工智能实验室公布一项内部代号为“浣熊”的智能垃圾分类系统,这是一个可以根据不同城市垃圾分类标准,自动识别上万种常见垃圾,迅速准确的进行垃圾分类的智能系统。‘浣熊’系统已存储超万条物品数据,能够实现日常生活垃圾全识别。基于AI(人工智能)训练模型的‘浣熊’系统还可主动升级垃圾数据库,自动适应不同城市分类要求。
人工智能自动分类垃圾的应用原理:
1、“垃圾”图像数据准备
为了实现一个理想的垃圾自动分类器,需要有一个已经分好类别的“垃圾”图像数据集作为训练的基础。然而当前并没有这样一个可以直接使用的数据集,所以我们首先自己动手收集海量的“垃圾”图像并为每张图像标注上相应的类别。数据集的收集一直是一件耗时耗力的工作,为了快速便捷地完成“垃圾”图像数据集的收集,我们依据官方发布的垃圾分类指南上每一类所包含的垃圾名称,通过在百度图片上爬取名称对应的图像来实现。
在实际的应用场景中,待分类的样本往往是不可控的,所以一般会增加“其他”这个类别用来收留各种异常样本。在垃圾分类中,除可回收物、有害垃圾和湿垃圾外都属于干垃圾,所以干垃圾已经扮演了“其他”的角色。我们的“垃圾”图像数据集最终分为可回收垃圾、有害垃圾、湿垃圾和干垃圾四个类别。
2、垃圾自动分类器
垃圾自动分类本质上是一个图像分类问题,当前基于深度卷积神经网络的图像分类算法发展很快,各种方法层出不穷。在深度学习出现之前,可变形部件模型(DPM)一直是流行的目标检测方法。深度学习出现后,以R-CNN、Fast R-CNN、Faster R-CNN为代表的两阶段算法和以YOLOv1-3、SSD、RetinaNet为代表的单阶段算法成为主流。前者是先由算法生成一系列待检测目标的候选框,再通过卷积神经网络进行候选框的分类;后者则不用产生候选框,直接将目标边框定位的问题转化为回归问题处理。
和垃圾分类器一样,一个理想的垃圾检测器,需要大量的“垃圾”标注数据来支撑。但是与分类数据集相比,检测数据集除了标注类别外还要标注图位置坐标,这样的标注工作更为艰巨。在完成垃圾检测的图像数据集后,就可以利用当前主流的深度学习检测算法来实现批量垃圾的分类。
以上就是人工智能自动分类垃圾的应用原理深度分析。在大家的实际生活中,人工智能对于垃圾分类的应用,可能还存在着许多的不足,但是相信未来随着人工智能技术的进一步发展,这些问题都能够迎刃而解。关于AI垃圾分类的原理,碍于篇幅的限制就暂时讲到这里啦。如果对于人能智能相关内容还有兴趣的小伙伴,可以继续关注博学谷资讯。
三、聚焦六新:人工智能未来何在?赋能山西大有可为
人工智能是新一轮 科技 革命和产业变革的重要驱动力量。山西各行各业如何+人工智能,助力转型综改?行业大咖纷纷表达自己的看法。
“我们的物流分拣设备在太原得到运用,还覆盖全国40%的快递分拣点,才能让大家享受如此快捷又低成本的物流便利。”中国科学院微电子研究所智能制造电子研发中心主任李功燕举例说明,新的信息技术为中国的智能制造领域提供了弯道超车的机会,有效降低了工业部件的成本,也提供了更多发展机遇。
而在新松机器人投资有限公司总经理武兴华看来,这样的发展会带来颠覆性的改变。新松机器人改变了中国机器人只有进口没有出口的 历史 。随着人工智能和信创产业的到来,未来将实现机器换人、机器超人,甚至机器替人。比如目前大比例的企业正在进行机器对人的替代,新松的教育机器人甚至可以在一定程度上替换掉顶级的老师。“目前,我们在研究人类意识和机器的结合,虽然还没有实质性的突破,但整体框架结构已经搭建起来。”武兴华如是说。
用好人工智能的同时,也要促进人工智能更好地成长。人工智能里最重要的就是建立模型、训练模型,需要大量标准的数据支撑,但很多电力公司40%-60%的数据是无效数据。如何给人工智能提供更准确的数据?云圣智能联合创始人朱胜利认为0-500米的新空间是未来发展、挖掘数据并服务于新基建的重要空间。“通过在新空间中采集新数据,把人工智能和信创产业结合在一起,才能为产业、国家和全球作出更大贡献。”朱胜利说。
事实上,除了企业发力,山西的支持政策也为人工智能提供了优越的成长空间。“信创产业是牵引其他产业发展的根基。太原市在发展信创产业方面就走在了全国的前列。山西省发展信创产业生态,以此来带动其他新兴产业发展,并把打造信创产业生态和创新高地作为战略工程、‘一号工程’,这样的定位是非常深远的。”山西百信信息技术有限公司董事长王宪朝说。
人工智能虽大有可为,但“安全”不可忽视。
中国长城 科技 集团股份有限公司副总裁谷虹认为,算例包括网络,是人工智能、云计算、大数据、区块链等诸多高新技术的基础,因而算例安全是非常重要的,但同时又是非常难做到的。因为算例竞争是全球竞争的最基本的核心点,经过多年的努力,中国的算例已经达到了一定的水平,甚至在某些领域走到了世界前列。我们现在有飞腾CPU、华为鲲鹏CPU。在算例安全中,产业安全也是重要的一环。“在此,我也呼吁相关的使用方、研发方可以考虑到算例的安全。”谷虹说。
相信在政府的大力支持、各界的共同努力下,山西的人工智能和信创产业一定会迎来更大的发展机遇,蹚出崭新的合作共赢之路。
四、大数据人工智能培训?
大数据人工智能培训推荐选择【达内教育】。大数据人工智能需要学习的东西如下:
1、数学基础。数学基础知识蕴含着处理智能问题的基本思想与方法,也是理解复杂算法的必备要素。这一模块覆盖了人工智能必备的数学基础知识,包括线性代数、概率论、最优化方法等。
2、机器学习。机器学习的作用是从数据中习得学习算法,进而解决实际的应用问题,是【人工智能】的核心内容之一。这一模块覆盖了机器学习中的主要方法,包括线性回归、决策树、支持向量机、聚类等。
3、人工神经网络。作为机器学习的一个分支,神经网络将认知科学引入机器学习中,以模拟生物神经系统对真实世界的交互反应,并取得了良好的效果。这一模块覆盖了神经网络中的基本概念,包括多层神经网络、前馈与反向传播、自组织神经网络等。
4、深度学习。包含多个中间层的神经网络,数据爆炸和计算力飙升推动了深度学习的崛起。这一模块覆盖了深度学习的概念与实现,包括深度前馈网络、深度学习中的正则化、自编码器等。感兴趣的话点击此处,免费学习一下
想了解更多有关大数据人工智能的相关信息,推荐咨询【达内教育】。【达内教育】重磅推出“因材施教、分级培优”创新教学模式,同一课程方向,面向不同受众群体,提供就业、培优、才高三个级别教学课程,达内“因材施教、分级培优“差异化教学模式,让每一位来达内学习的学员都能找到适合自己的课程。达内IT培训机构,试听名额限时抢购。
以上就是关于人工智能训练模型相关问题的回答。希望能帮到你,如有更多相关问题,您也可以联系我们的客服进行咨询,客服也会为您讲解更多精彩的知识和内容。
推荐阅读: