HOME 首页
SERVICE 服务产品
XINMEITI 新媒体代运营
CASE 服务案例
NEWS 热点资讯
ABOUT 关于我们
CONTACT 联系我们
创意岭
让品牌有温度、有情感
专注品牌策划15年

    全网搜索引擎一般采用

    发布时间:2023-03-05 03:48:43     稿源: 创意岭    阅读: 917        问大家

    大家好!今天让创意岭的小编来大家介绍下关于全网搜索引擎一般采用的问题,以下是小编对此问题的归纳整理,让我们一起来看看吧。

    创意岭作为行业内优秀的企业,服务客户遍布全球各地,相关业务请拨打电话:175-8598-2043,或添加微信:1454722008

    本文目录:

    全网搜索引擎一般采用

    一、搜索引擎的分类

    搜索方式是搜索引擎的一个关键环节,大致可分为四种:全文搜索引擎、元搜索引擎、垂直搜索引擎和目录搜索引擎,它们各有特点并适用于不同的搜索环境。所以,灵活选用搜索方式是提高搜索引擎性能的重要途径。

    全文搜索引擎是利用爬虫程序抓取互联网上所有相关文章予以索引的搜索方式;元搜索引擎是基于多个搜索引擎结果并对之整合处理的二次搜索方式;垂直搜索引擎是对某一特定行业内数据进行快速检索的一种专业搜索方式;目录搜索引擎是依赖人工收集处理数据并置于分类目录链接下的搜索方式。

    1、全文搜索引擎

    一般网络用户适用于全文搜索引擎。这种搜索方式方便、简捷,并容易获得所有相关信息。但搜索到的信息过于庞杂,因此用户需要逐一浏览并甄别出所需信息。尤其在用户没有明确检索意图情况下,这种搜索方式非常有效。

    2、元搜索引擎

    元搜索引擎适用于广泛、准确地收集信息。不同的全文搜索引擎由于其性能和信息反馈能力差异,导致其各有利弊。元搜索引擎的出现恰恰解决了这个问题,有利于各基本搜索引擎间的优势互补。而且本搜索方式有利于对基本搜索方式进行全局控制,引导全文搜索引擎的持续改善。

    3、垂直搜索引擎

    垂直搜索引擎适用于有明确搜索意图情况下进行检索。例如,用户购买机票、火车票、汽车票时,或想要浏览网络视频资源时,都可以直接选用行业内专用搜索引擎,以准确、迅速获得相关信息。

    4、目录搜索引擎

    目录搜索引擎是网站内部常用的检索方式。本搜索方式指在对网站内信息整合处理并分目录呈现给用户,但其缺点在于用户需预先了解本网站的内容,并熟悉其主要模块构成。总而观之,目录搜索方式的适应范围非常有限,且需要较高的人工成本来支持维护。

    全网搜索引擎一般采用

    工作方式

    搜索引擎为一组项目提供了一个接口,使用户能够指定关于感兴趣的项目的标准,并让引擎找到匹配的项目,这些标准称为搜索查询。在文本搜索引擎的情况下,搜索查询通常表示为识别一个或多个文档可能包含的期望概念的一组单词。

    有多种样式的搜索查询语法在严格性上有差异。它也可以在以前的站点中搜索搜索引擎中的名称。而一些文本搜索引擎要求用户输入由白色空格分隔的两个或三个字,其他搜索引擎可以使用户能够指定整个文档,图片,声音和各种形式的自然语言。

    一些搜索引擎对搜索查询进行改进,以增加通过称为查询扩展的过程提供质量集合的可能性。查询理解方法可用于标准化查询语言。

    基于索引的搜索引擎符合查询指定条件的项目列表通常会排序或排名。按相关性排列项目(从最高到最低)减少查找所需信息所需的时间。概率搜索引擎根据相似性度量(每个项目和查询之间,通常以1到0,1的比例最相似)和有时受欢迎程度或权限或使用相关性反馈来评估项目。

    布尔搜索引擎通常只返回匹配的项目,而不考虑订单,为了提供根据一些标准快速排序的一组匹配项目,搜索引擎通常将通过称为索引的过程来收集关于所考虑的一组项目的元数据。

    索引通常需要较少量的计算机存储,这就是为什么一些搜索引擎仅存储索引的信息而不是每个项目的完整内容,而是提供导航到搜索引擎结果页面中的项目的方法。

    或者,搜索引擎可以将每个项目的副本存储在高速缓存中,使得用户可以在索引时或为了归档目的看到该项目的状态,或者使得重复的进程更有效和更快地工作。其他类型的搜索引擎不存储索引。

    抓取器或蜘蛛型搜索引擎(也称为实时搜索引擎)可以在搜索查询时收集和评估项目,基于起始项目的内容(称为种子或种子URL)动态考虑附加项目互联网爬虫的情况)。元搜索引擎既不存储索引也不存储缓存,而只是重新使用一个或多个其他搜索引擎的索引或结果来提供聚合的最终结果集。

    以上内容参考 百度百科-搜索引擎

    二、中国搜索引擎检索的主要方式有哪两种?

    现有的搜索引擎基本上分为三类:

    1.1 single search engine(独立搜索引擎) 它的特点是仅在搜索引擎自身的数据库检索信息,比如Yahoo。

    1.2 Meta search engine(元搜索引擎) 它在检索信息时通过调用其它多个独立的搜索引擎来完成检索功能,并且能够将从多个独立搜索引擎查询的结果进行不同程度的处理,比如删除重复结果、校验连接、结果按照相关度排序等。元搜索引擎本身可以有也可以没有自己的数据库。由于不同的元搜索引擎挂接的独立搜索引擎各不相同,且各自独立的搜索引擎在查询语法上的差别较大,使得元搜索引擎本身仅支持AND、0R、N0T等简单的语法操作,返回的结果只能满足“最低常用分母”,即不能提高搜索结果的准确性。

    1.3 Net search engine(网络搜索软件) 就是网络用户可以将相应的搜索软件下载至本地的计算机上,安装查询,这是一种具有网络查询功能的离线浏览器。相对于元搜索引擎,它可以灵活地控制输出结果,其最大特点是方便用户使用和能快速地查询网络相关资源。2 网络搜索引擎的工作原理及其基本构成

    用户检索信息时,搜索引擎是根据用户的查询要求,按照一定的算法从索引数据库中查找对应的信息返回给用户。为了保证用户查找信息的精度和新鲜度。对于独立的搜索引擎而言.还需要建立并维护一个庞大的数据库。独立搜索引擎中的索引数据库中的信息是通过一种叫做网络蜘蛛(spider)的程序软件定期在网上爬行,通过访问公共网络中公开区域的每一个站点采集网页,对网络信息资源进行收集,然后利用索引软件对收集的信息进行自动标引,创建一个可供用户按照关键字等进行查询的web页索引数据库,搜索软件通过索引数据库为用户提供查询服务。所以,一般的搜索引擎主要由网络蜘蛛、索引和搜索软件三部分组成.

    网络蜘蛛。是一个功能很强的程序,它会定期根据预先设定的地址去查看对应的网页,如网页发生变化则重新获取该网页,否则根据该网页中的链接继续去访问。网络蜘蛛访问页面的过程是对互连网上信息遍历的过程。为了保证网络蜘蛛遍历信息的广度,一般事先设定_ 些重要的链接,然后进行遍历。在遍历的过程中不断记录网页中的链接,不断地遍历下去,直到访问完所有的链接。

    索引软件。网络蜘蛛将遍历搜索集得到的网页存放在数据库中。为了提高检索的效率,需要建立索引。索引一般为倒排档索引。

    搜索软件。该软件用于筛选索引数据库中无数的网页信息,选择出符合用户检索要求的网页并对它们进行分级排序。然后将分级排序后的结果显示给用户。

    3 搜索引擎的主要性能评价指标

    3.1 搜索引擎建立索引的方法 数据库中的索引一般是按照倒排文档的文件格式存放,在建立例排索引的时候,不同的搜索引擎有不同的选项。有些搜索引擎对于信息页面建立全文索引;而有些只建立摘要部分,或者是段落前面部分的索引;还有些搜索引擎,比如Google建立索引的时候,同时还考虑超文本的不同标记所表示的不同含义。如粗体、大字体显示的东西往往比较重要;放在锚链中的信息往往是它所指向页面的信息的概括,所以用它来作为所指向的页面的重要信息。Google、infoseek还在建立索引的过程中收集页面中的超链接。这些超链接反映了收集到的信息之间的空间结构,利用这些结果信息可以提高页面相关度判别时的准确度。由于索引不同,在检索信息时产生的结果会不同。

    3.2 搜索引擎的检索功能搜索引擎所支持的检索功能的多少及其实现的优劣,直接决定了检索效果的好坏,所以网络检索工具除了要支持诸如布尔检索、邻近检索、截词检索、字段检索等基本的检索功能之外,更应该根据网上信息资源的变化,及时地应用新技术、新方法,提高高级检索功能。另外,由于中文信息特有的编码不统一问题,所以如果搜索引擎能够实现不同内码之间的自动转换,用户就会全面检索大陆、港台乃至全世界的中文信息。这样不但提高了搜索引擎的质量,而且会得到用户的支持。

    3.3 搜索引擎的检索效果 检索效果可以从响应时间、查全率、查准率和相关度方面来衡量。响应时间是用户输入检索式开始查询到检出结果的时间。查全率是指一次搜索结果中符合用户要求的数目与和用户查询相关的总数之比;查准率是指一次搜索结果集中符合用户要求的数目与该次搜索结果总数之比;相似度是指用户查询与搜索结果之间相似度的一种度量。虽然由于无法估计网络上与某个检索提问相关的所有信息数量。所以目前尚没有定量计算查全率的更好方法,但是它作为评价检索效果的指标还是值得保留。查准率也是一个复杂的概念,一方面表示搜索引擎对搜索结果的排序,另一方面却体现了搜索引擎对垃圾网页的抗干扰能力。总之,一个好的搜索引辇应该具有较快的响应速度和高的查全率和查准率,或者有极大的相似度。

    3.4 搜索引擎的受欢迎程度 搜索引擎的受欢迎程度体现了用户对于搜索引擎的偏爱程度,知名度高、性能稳定和搜索质量好的搜索引擎很受用户的青睐。搜索引擎的受欢迎程度也会随着它的知名度和服务水平的变化而动态的变化。搜索引擎的服务水平和它所收集的信息量、信息的新鲜度和查询的精度相关。随着各种新的搜索技术的出现,智能化的、支持多媒体检索的搜索引擎将越来越受用户的欢迎。

    另外,搜索引擎的信息占有量也可以作为评价搜索引擎性能的指标。综上所述,评价搜索引擎的性能指标可以概括为:a.建立索引的方法(全文索引,部分索引,按重要程度索引等);b.检索功能(支持的检索技术,多媒体检索,内码处理等);C.查询效果(响应时间,查全率,查准率,相关度);d.受欢迎程度;e.信息占有量。4 搜索引擎检索信息的局限

    2001年Roper的调查指出,36% 的互连网用户一个星期花超过2个小时的时间在网上搜索;71% 的用户在使用搜索引擎时遇到过麻烦;平均搜索12分钟以后发现搜索受挫。另一项由Keen所做的调查显示,31% 的人使用搜索引擎寻找答案,网上查找答案的半数以上都不成功。从这些调查数据中不难看出。目前的搜索引擎仍然存在不少的局限性。概括起来大致有以下几个方面。

    4.1 搜索引擎对信息的标引深度不够 目前,搜索引擎检索的结果往往只提供一些线形的网址和包括关键词的网页信息,与人们对它的预期存在较大的距离,或者返回过多的无用信息,或者信息丢失,特别是对特定的文献数据库的检索显得无能为力。

    4.2 搜索引擎的信息量占有不足 作为搜索引擎必须占有相当大的信息量才能具有一定的查全率和实用性。目前还没有一种覆盖整个因特网信息资源的搜索引擎。

    4.3 搜索引擎的查准率不高 分析起来,这是因为:一方面由于网上信息数量巨大、内容庞大、良莠不齐,信息的质量得不到保障;另一方面是由于大多数搜索引擎的索引工作由程序自动完成,根据网页中词频及词的位置等因素确定关键词,有的网站为了提高点击率,将一些与网页主题并不相关的热门词汇以隐含方式放在页面上,并重复多次,从而造成查准率低。

    4.4 检索功能单一,缺乏灵活性 目前许多搜索引擎的查询方法比较单一,一般只提供分类查询方式和关键词查询方式。不能从文献的多个方面对检索提问进行限制,只能就某一关键词或者概念进行笼统的检索。

    4.5 搜索引擎自身的技术局限像目前部分搜索引擎还不能支持对多媒体信息的检索。造成上述信息检索困难的原因实质在于搜索引擎对要检索的信息仅仅采用机械的词语匹配来实现,缺乏知识处理能力和理解能力。也就是说搜索引擎无法处理用户看来是非常普通的常识性知识,更不能处理随用户不同而变化的个性化知识、随地域不同而变化的区域性知识以及随领域不同而变化的专业性知识等等。5 搜索引擎未来的发展趋势

    新一代搜索引擎的发展目标就是采用新兴的搜索技术为用户提供更方便易用、更精确的搜索工具来满足用户的信息查询需要。技术上,应该在自然语言理解技术上有所突破,以XML可扩展标记语言为主,并使用向导技术。下面就搜索引擎的发展趋势谈几点看法。

    <strong>答案补充</strong>

    5.1 垂直化专业领域搜索 由于社会分工的加大,用户从事的职业有所不同,不同用户对信息搜索也往往有自己的专业要求。由于综合性的搜索引擎收录各方面、各学科、各行业的信息,因而搜索不相关的信息太多,专业垂直引擎则可以解决这个问题,垂直类搜索引擎是只面向某一特定的领域,专注于自己的特长和核心技术,能够保证对该领域信息的完全收录与及时更新。因此,基于专业领域的“垂直搜索引擎”开始成为搜索引擎发展的一个新趋势。

    5.2 智能化搜索 传统的搜索引擎使用方法是被动搜索,而准确的搜索应建立在对收录信息和搜索请求的理解之上。显然,基于自然语言理解技术的搜索引擎由于可以同用户使用自然语言交谈,并深刻理解用户的搜索请求,则查询的结果更

    加准确。

    5.3 关联式的综合搜索 所谓关联式综合搜索,是这样一种一站式的搜索服务,它使得用户在搜索时只需要输入一次查询目标,即可以在同一界面得到各种有关联的查询结果,这种服务的关键在于有一架构在XML基础上的整合资讯平台。<strong>答案补充</strong>

    5.4 个性化搜索 提高搜索精确度的另一个途径是提供个性化的搜索,也就是将搜索建立在个性化的搜索环境之下,其核心是跟踪用户的搜索行为,通过对用户的不断了解、分析,积累用户的搜索个性化数据来提高用户的搜索效率。

    5.5 结构化搜索 所谓结构化搜索,是指充分利用XML等技术使信息结构化,同时使用查询结构化,从而使搜索的准确度大大提高。

    5.6 本土化的搜索 世界上许多著名的搜索引擎都在美国,它们以英语为基础,完全按他们的思维方式和观点搜集和检索资料,这对于全球不同国家的用户来说是显然不合适的。各国的文化传统、思维方式和生活习惯不同,在对于网站的内容的搜索要求上也就存在差异。搜索结果要符合当地用户的要求,搜索引擎就必须本土化。

    5.7 多媒体搜索。随着宽带技术的发展,未来的互联网是多媒体数据的时代,开发出可查询图像、声音、图片和电影的搜索引擎是一个新的方向,这也将极大地满足用户的需求。未来的搜索引擎应该信息量更大、搜索速度更快、搜索精度更高和更能够满足用户的信息查询需求。

    三、国内常用搜索引擎及功能介绍

    分类: 电脑/网络 >> 互联网

    问题描述:

    请各位同仁们给我讲讲国内常用搜索引擎及功能的介绍,谢谢。。越详细越好。。感谢啦。。

    解析:

    1.百度是国内最大的商业化全文搜索引擎,占国内80%的市场份额。其功能完备,搜索精度高,除数据库的规模及部分特殊搜索功能外,其他方面可与当前的搜索引擎业界领军人物Google相媲美,在中文搜索支持方面有些地方甚至超过了Google,是目前国内技术水平最高的搜索引擎。为包括Lycos中国、Tom、21CN、广州视窗等搜索引擎,以及中央电视台、外经贸部等机构提供后台数据搜索及技术支持。

    2.“妮妮,Google真的很好用,这些日子仔细研究,嘻嘻,不好意思,就是试了试Google的功能,越来越喜欢用了。可是,Google到底是国外的产品,国内的搜索引擎有没有类似的呢?”

    “看来美美很……啊。要说国内的搜索引擎不能不提百度。年轻的百度公司自2000年6月起迅速地拿下了硅谷动力、Chinaren、搜狐、新浪、21CN、广州视窗、263、TOM等门户网站的全文搜索引擎服务,成为中文检索市场中的佼佼者。百度的成功不但使中国网民有更好的搜索体验,也激励了同行的进取心,使得国内中文搜索引擎的发展进入你争我赶的良性发展时代。”

    “啊,那么多著名的网站的搜索引擎原来使用的是同一家搜索引擎服务公司的服务啊。那岂不是用哪个都一样了。”

    “不完全如此。大部分网站使用的是百度公司的网页搜索服务,并且这一服务也是按照各个网站的个性化要求重新设定的,因此仍然是各具特色。”

    “咦,你好象没有提到网易和Yahoo?”

    “美美果然是变成搜索通了,网易、Yahoo使用的是Google的网页搜索服务。”小张说。

    “原来如此。”

    “既然美美已经掌握了大部分的搜索方法与技巧,我看在各家搜索引擎的使用方面由美美自己练习就可以了。我们主要介绍一下各家搜索引擎的特点吧。

    你看呢,妮妮?”

    “好,那我们就介绍几家比较有代表性的吧。就介绍新浪、网易、搜狐、263。”

    新浪

    “新浪搜索是目前互联网上规模最大的中文搜索引擎之一,网站收录资源丰富,以中文网站GB码为主。分类目录规范细致,层次合理,遵循中国用户习惯。”

    “去年,也就是2000年11月,新浪搜索推出了新一代综合搜索引擎,这可是中国第一家可多个数据库查询的综合搜索引擎啊。”

    “综合搜索是怎么回事?”

    “所谓综合搜索就是一次输入搜索关键词,符合查询条件的搜索结果,不管它是新闻、网站还是网页都会显示在用户眼前。”

    “噢,这多方便啊。连新闻都可以搜出来?”

    “是。全新的新浪综合搜索方便实用,省却了用户分门别类搜索的麻烦.这些全方位的资讯依照与搜索条件符合的程度排列,在保持快速、准确的基础上,给用户提供了更多的选择。”

    “这挺抽象的。让我来试一下,在新浪搜索中输入‘刘德华’,天啊,不仅可以查到关于刘德华的网站,还可以搜索到关于刘德华的最新动态、照片等等许多信息。太好了。”

    “同样的,搜索‘mp3’,就可以轻而易举地搜出各种关于mp3的目录和网站;mp3播放机的图片;在新浪内容板块中找到诸如:最新的mp3播放软件、mp3播放机、MP3的数码相机等及时、详尽的相关信息;在商品信息中了解最新mp3产品的品牌、价格、技术参数等资料。”

    “新浪搜索还有一些特点。比如,在搜索结果相关方面提供与所搜索的关键词最为相关的部分内容供选择。当搜索‘oicq’时,在给出包含符合搜索要求的目录、网站、新浪内容、商品信息等综合结果外,还会根据以往用户的搜索习惯提供诸如:icq、腾讯、oicq工具、腾讯oicq、oicq下载等相关的关键词供选择,如果用户正好接下来想搜oicq工具的相关内容,只要在网页上给出的oicq工具这个词上轻轻一点就可以了。”

    “对了,其实关于相关关键词这一技术可并非是新浪独有的,其实这是百度公司的技术,所以,百度的客户,比如搜狐、263等都有这一功能。”

    “此外,新浪搜索特别设有搜索论坛,如果用户在搜索中有什么不明白的地方,或是有一时搜不到的东西,到搜索论坛中提问,就立即会有热心网友解答,形成了一种搜索教帮的文化。”

    “是啊,搜索论坛可是很有人气的啊。其实,我和小张的很多搜索知识都是从论坛里学来的。搜索论坛里的VIP网友以及坛主可都是知识丰富的搜索高手呢,比如搜索引擎9238、shuxun、wyle等等。”

    网易

    “网易搜索引擎采用模糊搜索方式(就是我们之前提过的智能分词技术)对用户输入的关键词,先作语言分析,分解成多个词或词组,再去数据中心匹配结果,因此允许用户输入整句。”

    “真的呀。那可太方便了,有时候我就是搞不懂该用什么样的多个关键词搜索。”

    “网易搜索引擎提供多语言检索,英语,日语,俄语等几十种语言关键词都可以直接输入搜索框检索网页资料。其实这应该算是Google的功劳。”

    “此外,网易拥有全国最大的开放式管理目录ODP,有约5000名各行业目录管理员负责管理网站注册信息。美美,是不是想知道ODP是怎么回事啊?”

    “嗯,什么是ODP?”

    “ODP是Open Directory Project(开放式目录管理)的缩写。 从诞生至今,只有短短三年的历程。1998年6月,当时一位程序员Rich Skrenta对Yahoo!的搜索结果中经常出现老的和死的链接感到非常厌烦,于是他在Inter上发出了倡议,请求位于全球各地的Inter用户都志愿来帮助编辑这个目录。倡议很快得到了很多热心志愿者的支持,于是划时代的管理方式ODP就此诞生。国外比较著名的ODP网站当属Dmoz,它由4万多名志愿编辑免费,提供给任何个人和组织免费使用。Google的网站搜索其实就是Dmoz的杰作。”

    搜狐

    “搜狐公司于1998年推出中国首家大型分类查询搜索引擎,经过几年的发展,其内容更新迅速,网站收录资源丰富,以中文网站为主,如今累计收录中文网站已达150多万,?每日浏览量超过800万。搜狐有很多技术、功能与新浪类似,在此就不多说了。”

    263首都在线

    “263首都在线的搜索引擎可谓百度公司技术的完美体现,因为它从网页搜索到网站搜索都使用了百度的技术,为广大中文网络用户提供丰富有效的目录指南服务和全文检索服务。它比较有特色的地方是除了提供基本的分类查询和关键字查询,还为用户增加本周新站、好站推荐、热门关键字搜索、专题搜索、搜索留言版等多项服务。”

    “好了,国内几大搜索引擎的情况就介绍到这里,此外还有很多比如天网、网擎、中国导航等等,美美可以通过阅读相关的搜索文章了解。”

    0.ccid/school2001/12/06/99_5632

    四、中国人用百度 外国人用什么搜索引擎??

    国外使用谷歌搜索居多。

    搜索引擎:

    搜索引擎(Search Engine)是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。搜索引擎包括全文索引、目录索引、元搜索引擎、垂直搜索引擎、集合式搜索引擎、门户搜索引擎与免费链接列表等。

    全球知名的搜索引擎有如下这些:

    谷歌、百度、雅虎、360搜索、腾讯搜搜。搜狗等。

    以上就是关于全网搜索引擎一般采用相关问题的回答。希望能帮到你,如有更多相关问题,您也可以联系我们的客服进行咨询,客服也会为您讲解更多精彩的知识和内容。


    推荐阅读:

    「最美应用」搜你妹:一款集全网资源且免费下载音乐的软件,90% 的音乐狂都离不开它

    全网营销推广

    全网曝光平台

    数字1图片创意(数字1图片创意图片霸气)

    中国最好的室内设计师(中国最好的室内设计师培训)