如何提取关键词(如何提取关键词公开课)
大家好!今天让创意岭的小编来大家介绍下关于如何提取关键词的问题,以下是小编对此问题的归纳整理,让我们一起来看看吧。
开始之前先推荐一个非常厉害的Ai人工智能工具,一键生成原创文章、方案、文案、工作计划、工作报告、论文、代码、作文、做题和对话答疑等等
只需要输入关键词,就能返回你想要的内容,越精准,写出的就越详细,有微信小程序端、在线网页版、PC客户端
创意岭作为行业内优秀的企业,服务客户遍布全球各地,如需了解SEO相关业务请拨打电话175-8598-2043,或添加微信:1454722008
本文目录:
一、怎样提取关键词
提取时,要注意以下三点:
一是筛选陈述的对象(主要概念或主要事件)或议论的中心观点。
三是要注意与归纳概括信息题的不同。提取的关键性词语的答案一般就在所给语段中,不需要我们自己去概括,或者用我们的理解来替代本来就存在的关键信息;而概括信息大多数情况则是对所给信息进行分析、归纳、整合,在语言表述上,可以是所给语段中现成的关键性词语,也可以是高度概括了的能够替代原语言信息的词语。
【考题再现】
(2010年高考江苏卷第3题)阅读下面一段文字,找出“碳链式反应”过程的三个关键性词语。
科学家在喀斯特地貌的研究中,发现了一个复杂的碳链式反应。当水流从空气中“大口吮吸”二氧化碳并侵蚀石灰岩时,持续不断的吸碳过程就开始了。接着,在岩石表面自由流淌的酸性水流携带着大量碳酸氢根,随着自然界的水循环辗转奔向江河湖海。此时,浮游植物体内的“食物加工厂”在急切地“找米下锅”,它们惊喜地发现,只要分泌一种叫做“碳酸酐酶”的催化剂,对水中的碳酸氢根“略施魔法”,等待加工的“米”——二氧化碳,就唾手可得。最终,光合作用将大量随波逐流的碳转化成有机碳,封存于水生生物体内。
【解析】
1.读题,明确题干要求以及文段的主要表述对象或主要事件或议论的中心观点。本题题干要求就是找出“碳链式反应”过程的三个关键性词语,文段的主要表述对象就是碳链式反应。
2.整体把握段落,区分句间关系,划分层次。本段落共有5句话,其中第1句话指出了说明的中心——科学家发现了碳链式反应。再根据表示过程的“开始”“接着”“最终”三个序数词,把其余的4句话分为三层,其中3、4句为一层,第2句、第5句各为一层。
3.筛选与主概念相对应的谓语动词或总结性的词语。根据上述分析,提取的关键词是表示过程的,因此可以确定第1个层次与“开始”相对应的核心动词是“吸碳”,第2个层次与“接着”相对应的核心动词是“略施魔法”,第3层次与“最终”相对应的核心词是“光合作用”,由此可得出三个关键性词语。
【参考答案】
(1)吸碳;(2)“略施魔法”;(3)光合作用。
【牛刀小试】
请筛选整合下面文字中的主要意思,提炼出关于“碳中和”定义的4个关键词语,并要注意四个词语的顺序。
“碳中和”的目的是为了环保。人们计算自己日常活动制造的二氧化碳排放量,包括直接的和间接的,并计算抵消这些二氧化碳所需的经济成本。人们可以通过植树或其他环保项目吸收大气中相应的二氧化碳;个人也可以付款给专门企业或机构,由这些企业或机构通过植树或其他环保项目吸收大气中相应的二氧化碳。2006年,《新牛津美国字典》将“碳中和”评为当年年度词汇。它已经从最初由环保人士倡导的一项概念,逐渐获得越来越多民众支持,并且成为受到许多国家政府当局所重视的实际绿化行动。
二、怎么在一堆图片中抓取关键词
可以用抽取方法。
有监督无监督抽取方法:无监督关键词提取方法主要有三类:基于统计特征的关键词提取(TF,TF-IDF);基于词图模型的关键词提取(PageRank,TextRank);基于主题模型的关键词提取(LDA)基于统计特征的关键词提取算法的思想是利用文档中词语的统计信息抽取文档的关键词;基于词图模型的关键词提取首先要构建文档的语言网络图,然后对语言进行网络图分析,在这个图上寻找具有重要作用的词或者短语,这些短语就是文档的关键词;基于主题关键词提取算法主要利用的是主题模型中关于主题分布的性质进行关键词提取;
将关键词抽取过程视为二分类问题,先提取出候选词,然后对于每个候选词划定标签,要么是关键词,要么不是关键词,然后训练关键词抽取分类器。当新来一篇文档时,提取出所有的候选词,然后利用训练好的关键词提取分类器,对各个候选词进行分类,最终将标签为关键词的候选词作为关键词。
三、word上如何提取关键字
在Word中,可以通过查找和替换功能来标记所有关键词,其具体的操作步骤:
1、单击开始----查找按钮;
2、弹出查找和替换对话框,在查找输入框中输入要做标记的关键词;
3、切换到替换选项卡,在替换为输入框中输入与查找相同的内容,单击格式按钮,在下拉选项中选择突出显示;
4、单击全部替换按钮即可。
四、TextRank——关键词提取
TextRank 算法可以脱离语料库的背景,仅对单篇文档进行分析就可以提取该文档的关键词。
TextRank 算法基于 PageRank 算法的。 PageRank 算法是一种网页排名算法,其基本思想有两条:
d 表示阻尼系数,为了解决没有入链网页的得分。 在 0.85 的阻尼系数下,大约 100 多次迭代 PR 值就能收敛到一个稳定的值,而当阻尼系数接近 1 时,需要的迭代次数会陡然增加很多,且排序不稳定。
链接网页的初始分数如何确定: 算法开始时会将所有网页的得分初始化为 1,然后通过多次迭代来对每个网页的分数进行收敛。收敛时的得分就是网页最终得分。若不能收敛,也可以通过设定最大迭代次数来对计算进行控制,计算停止时的分数就是网页的得分。
https://www.zybuluo.com/evilking/note/902585
以上就是关于如何提取关键词相关问题的回答。希望能帮到你,如有更多相关问题,您也可以联系我们的客服进行咨询,客服也会为您讲解更多精彩的知识和内容。
推荐阅读: