HOME 首页
SERVICE 服务产品
XINMEITI 新媒体代运营
CASE 服务案例
NEWS 热点资讯
ABOUT 关于我们
CONTACT 联系我们
创意岭
让品牌有温度、有情感
专注品牌策划15年

    关键词提取(关键词提取算法)

    发布时间:2023-04-08 12:14:49     稿源: 创意岭    阅读: 53        

    大家好!今天让创意岭的小编来大家介绍下关于关键词提取的问题,以下是小编对此问题的归纳整理,让我们一起来看看吧。

    开始之前先推荐一个非常厉害的Ai人工智能工具,一键生成原创文章、方案、文案、工作计划、工作报告、论文、代码、作文、做题和对话答疑等等

    只需要输入关键词,就能返回你想要的内容,越精准,写出的就越详细,有微信小程序端、在线网页版、PC客户端

    官网:https://ai.de1919.com

    创意岭作为行业内优秀的企业,服务客户遍布全球各地,如需了解SEO相关业务请拨打电话175-8598-2043,或添加微信:1454722008

    本文目录:

    关键词提取(关键词提取算法)

    一、怎样提取关键词

    提取时,要注意以下三点:

    一是筛选陈述的对象(主要概念或主要事件)或议论的中心观点。

    三是要注意与归纳概括信息题的不同。提取的关键性词语的答案一般就在所给语段中,不需要我们自己去概括,或者用我们的理解来替代本来就存在的关键信息;而概括信息大多数情况则是对所给信息进行分析、归纳、整合,在语言表述上,可以是所给语段中现成的关键性词语,也可以是高度概括了的能够替代原语言信息的词语。

    【考题再现】

    (2010年高考江苏卷第3题)阅读下面一段文字,找出“碳链式反应”过程的三个关键性词语。

    科学家在喀斯特地貌的研究中,发现了一个复杂的碳链式反应。当水流从空气中“大口吮吸”二氧化碳并侵蚀石灰岩时,持续不断的吸碳过程就开始了。接着,在岩石表面自由流淌的酸性水流携带着大量碳酸氢根,随着自然界的水循环辗转奔向江河湖海。此时,浮游植物体内的“食物加工厂”在急切地“找米下锅”,它们惊喜地发现,只要分泌一种叫做“碳酸酐酶”的催化剂,对水中的碳酸氢根“略施魔法”,等待加工的“米”——二氧化碳,就唾手可得。最终,光合作用将大量随波逐流的碳转化成有机碳,封存于水生生物体内。

    【解析】

    1.读题,明确题干要求以及文段的主要表述对象或主要事件或议论的中心观点。本题题干要求就是找出“碳链式反应”过程的三个关键性词语,文段的主要表述对象就是碳链式反应。

    2.整体把握段落,区分句间关系,划分层次。本段落共有5句话,其中第1句话指出了说明的中心——科学家发现了碳链式反应。再根据表示过程的“开始”“接着”“最终”三个序数词,把其余的4句话分为三层,其中3、4句为一层,第2句、第5句各为一层。

    3.筛选与主概念相对应的谓语动词或总结性的词语。根据上述分析,提取的关键词是表示过程的,因此可以确定第1个层次与“开始”相对应的核心动词是“吸碳”,第2个层次与“接着”相对应的核心动词是“略施魔法”,第3层次与“最终”相对应的核心词是“光合作用”,由此可得出三个关键性词语。

    【参考答案】

    (1)吸碳;(2)“略施魔法”;(3)光合作用。

    【牛刀小试】

    请筛选整合下面文字中的主要意思,提炼出关于“碳中和”定义的4个关键词语,并要注意四个词语的顺序。

    “碳中和”的目的是为了环保。人们计算自己日常活动制造的二氧化碳排放量,包括直接的和间接的,并计算抵消这些二氧化碳所需的经济成本。人们可以通过植树或其他环保项目吸收大气中相应的二氧化碳;个人也可以付款给专门企业或机构,由这些企业或机构通过植树或其他环保项目吸收大气中相应的二氧化碳。2006年,《新牛津美国字典》将“碳中和”评为当年年度词汇。它已经从最初由环保人士倡导的一项概念,逐渐获得越来越多民众支持,并且成为受到许多国家政府当局所重视的实际绿化行动。

    二、怎么在一堆图片中抓取关键词

    可以用抽取方法。

    有监督无监督抽取方法:无监督关键词提取方法主要有三类:基于统计特征的关键词提取(TF,TF-IDF);基于词图模型的关键词提取(PageRank,TextRank);基于主题模型的关键词提取(LDA)基于统计特征的关键词提取算法的思想是利用文档中词语的统计信息抽取文档的关键词;基于词图模型的关键词提取首先要构建文档的语言网络图,然后对语言进行网络图分析,在这个图上寻找具有重要作用的词或者短语,这些短语就是文档的关键词;基于主题关键词提取算法主要利用的是主题模型中关于主题分布的性质进行关键词提取;

    将关键词抽取过程视为二分类问题,先提取出候选词,然后对于每个候选词划定标签,要么是关键词,要么不是关键词,然后训练关键词抽取分类器。当新来一篇文档时,提取出所有的候选词,然后利用训练好的关键词提取分类器,对各个候选词进行分类,最终将标签为关键词的候选词作为关键词。

    三、读书时需要提取的五类关键词

    【引言】

    * 关键词,keywords,源于图书馆学,论文专著、网络搜索会用,指能体现一篇文章或一部著作的中心概念的词语,也指检索资料时所查内容中必须有的词语。在读书中,我们可以通过提取五类关键词,实现更好的阅读效果。

    【框架关键词】

    * 第一类关键词是框架关键词。框架关键词是我们建立一本书或者一门课框架的关键词,可以理解为知识结构中的节点,知识要通过这些节点进行连接。

    * 如何提取框架关键词?这要求我们在读书的时候找到一些讲知识连接的句子,这些句子就是在建立一些关键词之间的联系。比如《学会提问》这本书吧里面讲的论证三要素,包括论题、结论和理由,就是是三个框架关键词;又如《洋葱阅读法》里面的快速阅读、深度阅读、主题阅读、碎片阅读,书里在每一章前面讲了一下他们之间的联系,这些也可以认为是框架关键词。

    * 总的来说,框架关键词是作为知识连接节点的关键词,这个的话对于对理解一本书、记忆一本书,或者建立知识体系都是非常有用的。

    【致用关键词】

    * 第二类关键词是致用关键词。致用关键词的作用是能够启发我们想到某一个致用类的工具,比如RIA这个关键词就是一个致用类的关键词,它代表的也是一种工具、一种方法,是我们给这种工具和方法命的名。

    * 如何更好地提取致用关键词?最好的方法是写RIA便签,致用关键词是I便签里的what,这是个什么工具。通过I,A1,A2写作,我们能够深刻理解致用类关键词。

    * 比如昨天少毅老师讲的课程里面讲到这个行业趋势、时代趋势、公司分析,我们可以给看成框架关键词,也能看成致用关键词,尤其是公司分析关键词,下面分了四个方向:护城河,商业模式,领导,管理模式,这实际上是一套工具,这就是一个致用关键词,就是提示我们这个工具的名称是什么,写个便签深刻理解,拆为己用。

    【疑问关键词】

    * 第三类关键词是疑问关键词。可以套用一下《学会提问》里的概念,一些词会引起歧义,我们就认为它是疑问关键词。就像《表象与本质》里面举的“意思”这个词,意思的含义太多了,“你到底是什么意思?你就是意思意思?不是这个意思?那是什么意思?”这类词就是疑问关键词,能够引发我们疑问,能够引发我们进行批判性思考的一类关键词。

    * 如何提取疑问关键词?我们在读书时,如果觉得不同意、觉得很奇怪,觉得有问题时,就可以把这句话里面的某一个最关键的词语提取出来,作为一个疑问关键词。比如阅读《学会提问》,里面翻译有一句话“本书所谓的价值观(values),是指人们认为较有价值的那些观念”,看的很懵,明显不知所云,这里的价值观就是一个疑问关键词。

    【突破关键词】

    * 第四类的是突破关键词。这类关键词就是我们在读书的时候看到一个概念、一句话时,感觉打开了一扇新的窗户,感觉非常棒,aha时刻来了,这个时候往往有很多认知的突破,这个点是突破关键词的来源,也可能是这本书让我们感觉收获最大的地方。

    * 如何提取突破关键词?靠感觉。就是我们醍醐灌顶、茅塞顿开的时候,就是突破关键词出现的时候。

    * 例如,就是我在读《心流》的时候,里面的一个词叫自成目标,印象非常深,讲的就是这件事本身就是目标,它不是手段,在自成目标的地方,我们更能达到乐趣的程度,也更能容易进入心流。当时我看到自成目标这个词的时候,就感觉眼前一亮,这本书甚至这个方向都变得很清晰,这就是突破关键词的地方。又如,《表象与本质》里面的范畴化这个词,这个动态的词语让我对人类类比思维的特点有了很直觉的体验,这也是一个突破关键词。

    【探索关键词】

    * 最后一类关键词是探索关键词。如果我们在读书时,如果对某个概念,某个问题,某个领域非常有兴趣,觉得我们有长期探索的必要,或者有长期探索的意愿,那就是探索关键词,在采铜的《精进》里这叫“第四类问题”,值得长期探索的问题。

    * 如何提取探索关键词?好奇心驱动,对未知世界保持永不停息的热情。有时候是我们的疑惑,有时候是我们痛点,遇到了不要放过,可能会给我们开辟新的战场,一个以后努力的方向。

    * 比如说时间管理这个词,时间管理、精力管理是我们可以长期探索的,适合自己的时间管理方法是要长期实践的,这就是探索关键词。还有像存在主义中“存在”这个词、论语里“仁”这个词,或者像阿德勒讲的“课题分离”,像这些,可能一时我们弄不太懂,但是可以作为一个长期的探索的一个方向,这就探索关键词。

    【总结】

    * 总结一下,框架关键词是知识连接的节点,致用关键词是一个致用类工具,疑问关键词是我们批判性思维的发力点,突破关键是我们一本书醍醐灌顶和收获最大的点,探索关键词是我们长期一个问题方向。

    * 这五类关键词实际上并不是泾渭分明的,有一些关键词词同时有多个属性,所以说是我们读书时,只只要属于这几类就可以提取出来,通过这五个方向去做,我觉得读书效果会不错。

    四、怎么提取关键字

    .第一种方法:从语段中心话题入手

    第一步:明确陈述的话题(对象)

    任何语段,无论是记叙、议论或说明,它总是围绕一个话题来展开的,体现话题的词语肯定是关键词之一。那么,我们就要根据不同文体来寻找语段话题(重要信息)。

    第二步:寻找与陈述对象(主概念)相对应的谓语动词

    我们主要是寻找和明确与主要话题(主概念)相对应的谓语动词或总结性的词语。

    第三步:将几个词语连缀成句(主谓结构)。

    话题和谓语等词句选定后,我们可将几个词语稍稍连缀成一个谓结构的句子。

    第四步:筛选,提炼出关键词。

    我们把连缀成的句子放入文段中检验,如能基本表达出文段的中心内容,即可筛选并敲定关键词.

    通读后,我们可以发现 最后一个句子就是本段的中心句,而“舍貌取神”又是这个句子的核心。只要我们抓住这个句子,找出“貌”“取”“神”三字的各自所指,就能轻易套牢其中的三个关键词——“意象”“体味”“神髓”,再用上面所讲的方法,找出本语段的话题对象——“书法”,另一关键词也便找出来了。

    关键词是SCI论文中必不可少的部分,对论文具有重大意义。关键词不仅可以吸引审稿编辑和读者,还可以影响论文的检索率,从而影响论文的传播度。

    首先,从论文内容来说,作者可以从标题和论文中提取关键词。

    1)概念转换

    为了更准确、适度地表达主题,常常要对主题的概念进行转换,主题概念的转换不能光从字面上进行,而要从主题概念的涵义上进行,因此要特别注意概念的综合分析。

    具体解决的方法:主题概念的转换,按复杂程度,有概念直接转换和概念的分解转换两种方式。概念的直接转换只需直接查阅词表就可完成,概念的分解转换却要复杂得多。在概念转换的过程中,标引者不仅需要有广博的知识,还需要有丰富的想像力,如标引“下肢不等长”一词时,可能想到的可以概念转换的词就有:“短肢畸形”、“肢体短缩”、“肢体不等长”等,而正确的标引是:“腿长不等”。

    2)词表应用问题

    很多人对于论文关键词的选择有一定的随意性,并不是按照已有的医学论文关键词表来选择适合自己论文的关键词。因此,大家在学术论文写作过程中,对于关键词的确定可以根据《MeSH》词表规定。特别是医学方面的学术论文更加应该重视,因为在医学上很多专业术语与我们平常用的医学术语是不一样的。

    以上就是关于关键词提取相关问题的回答。希望能帮到你,如有更多相关问题,您也可以联系我们的客服进行咨询,客服也会为您讲解更多精彩的知识和内容。


    推荐阅读:

    销售岗位的关键词(销售岗位的关键词是什么)

    可以搜索关键词的网站(可以搜索关键词的网站推荐)

    小红书怎么搜关键词(小红书怎么搜关键词找笔记)

    山东水池假山景观设计(山东水池假山景观设计方案)

    中国地区美女排行榜前十名(中国地区美女排行榜前十名有哪些)