搜索引擎(Search Engines)是一个对互联网上的信息资源进行搜集整理,供用户查询的系统。由于互联网已经成为人类最大的信息源,所以搜索引擎被科学界定义为人类发现新知识最有效果的手段,作为仅次于电子邮件的应用之一,搜索引擎已经成为不可替代的信息查询工具。互联网提供了即时丰富的信息(以及人与人沟通参与/娱乐的平台),深层影响着现代人的生活。但随着网站数量和内容的急增,互联网就像是没有目录的巨大百科全书,让人们无法找寻自己想要的信息。搜索引擎的出现,为这本百科全书加上了目录和索引。不论我们想从互联网中寻找什么,只需要在搜索框中敲入关键词汇,就能够获得相关的信息或网址。
因此他对我们人类科学进步的影响意义深远。
搜索引擎的发展经历了三个阶段:
第一代搜索是主要依靠人工分拣的分类目录搜索,目录搜索引擎是把搜索到的信息资源按 一定的主题进行分门别类,建立目录,大目录下面包含子目录,子目录下又包含子目录……如此下去,建立一层层具有包含关系的目录,用户查找信息时,采取逐层浏览打开目录,逐步细化,就可以查到要找的信息。无论是纯技术型的搜索引擎还是分类目录,都可以认为是互联网上的第一代搜索引擎,出现于1994年前后,以Altavista、YAHOO和Infoseek为代表,搜索结果的好坏往往用反馈结果的数量来衡量,也就是说,第一代搜索引擎“求全”。
第二代搜索是依靠机器抓取,建立在超链分析基础上的网页搜索”,1998年,以Google和DirectHit为代表的第二代搜索引擎出现在互联网上,这些引擎的主要特点是提高了查准率,可以用“求精”来描述。
第三代搜索引擎是互动式搜索,在用户输入一个查询词时,尝试理解用户可能的查询意图,给与多个主题的搜索提示,引导用户更快速准确定位自己所关注的内容。GOOGLE推出全文检索技术后,人们对搜索的需求已经不再是能提供多少 包含了“关键词”的网页了,而是能不能以最快的方式提供最有价值的信息,并能弥补“人”本身在关键字描述方面的欠缺。因此,以人为本的智能搜索技术便 出线了,虽然看上去智能搜索引擎更象是第二代搜索引擎的补充和完善,但已经 在不知不觉中改变了人们的搜索习惯。中文智能搜索引擎的代表是——中国搜索。
第三代搜索引擎的优势:
1.中文输入智能查询:当用户输错了关键字、或用拼音、以及南方口音输入关键词时,智能搜索引擎都能自动提示用户正确的结果。大家都知道在语言中汉语是最复杂的,地域性质,后鼻音的因素,使得在用户在输入信息的时候出现差错。
2.区域智能查询:智能搜索却能按照区域进行查询,只要先确定查询的区域,直接输入关键字就可以了。
3.分类智能搜索技术:当用户在输入“绿茶”,在结果选项中会出现只能导航条目。这样可以让用户直接体会到智能带来的信息准确性。
4.内容聚类搜索:
就是自动分析搜索结果,再把所有与某个搜索结果内容 相关的网页聚集在一起。
5.专业搜索功能
智能搜索不仅是搜索技术上的智能化,还包括服务方面的专业化。 因为有些搜索需求是“重质量、不重数量”,比如歌曲下载、FLASH、图片搜索, 有些则对信息的时效性要求很高,比如新闻搜索。中国搜索将网民的一些常用搜索专业化,直接给出下载地址,无须再一条条地查找。
第三代搜索引擎的工作原理:搜索引擎大致可分两大循环系统——检索系统和网页抓取系统(非标准名称),网页抓取系统主要作用是收集互联网中的网页数据并存储在数据库中,而检索系统主要是根据网民的要求把储存在数据库中的相关网页提供给用户。
时代在变迁,技术在飞跃。被成为中国搜索引擎第一人的陈沛曾说过:“搜索无处不在”搜索的发展将是整个互联网技术的前沿代表。
未来的搜索的发展趋势就是搜索引擎越来越平台化,互联网的很多应用是逐渐建在一个平台化之上,并且使得搜索引擎公共化,个人化,个性化。
安徽新华电脑学校专业职业规划师为你提供更多帮助【在线咨询】