Categories


Tags


搜索引擎发展历程

搜索引擎是伴随互联网的发展而产生和发展的,互联网已成为人们学习、工作和生活中不可缺少的平台,几乎每个人上网都会使用搜索引擎。搜索引擎大致经历了四代的发展: 

1、第一代搜索引擎

1994年第一代真正基于互联网的搜索引擎Lycos诞生,它以人工分类目录为主,代表厂商是Yahoo, 特点是人工分类存放网站的各种目录,用户通过多种方式寻找网站,现在也还有这种方式存在。 

2、第二代搜索引擎

随着网络应用技术的发展,用户开始希望对内容进行查找,出现了第二代搜索引擎,也就是利用关键字来查询,最其代表性最成功的是Google,它建立在网页链接分析技术的基础上,使用关键字对网页搜索,能够覆盖互联网的大量网页内容,该技术可以分析网页的重要性后.将重要的结果呈现给用户。 

3、第三代搜索引擎

随着网络信息的迅速膨胀,用户希望能快速并且准确的查找到自己所要的信息,因此出现了第三代搜索引擎。相比前两代第三代搜索引擎更加注重个性化、专业化智能化使用自动聚类、分类等人工智能技术,采用区域智能识别及内容分析技术,利用人工介入,实现技术和人工的完美结合,增强了搜索引擎的查询能力。第三代搜索引擎的代表是Google,它以宽广的信息覆盖率和优秀的搜索性能为发展搜索引擎的技术开创了崭新的局面。  

4、第四代搜索引擎

随着信息多元化的快速发展,通用搜索引擎在目前的硬件条件下要得到互联网上比较全面的信息是不太可能的,这时,用户就需要数据全面、更新及时、分类细致的面向主题搜索引擎,这种搜索引擎采用特征提取和文本智能化等策略,相比前三代搜索引擎更准确有效,被称为第四代搜索引擎。

Public @ 2009-09-09 16:22:56

你真的会用搜索引擎吗?

你会使用搜索引擎吗?当然,每个人都会!根据《2019搜索引擎使用报告》,85%左右的用户都能找到满意的搜索结果。大部分人对搜索引擎的使用,仅仅停留在输入关键字点击搜索的层次。但这对于信息的高效检索来说,还不够。下面以搜索引擎为中心,谈谈在互联网上提高检索信息效率的技巧。什么叫提高检索效率呢?在保证检索准确度的前提下提高检索速度。只有结果准确的情况下,提高检索速度才有意义。切忌一味追求速度,本末倒置

Public @ 2017-05-11 15:34:23

如何让我的网页不被百度收录?

1. 在Robots.txt文件中添加抓取禁止索引指令:User-agent: Baiduspider ,Disallow: / 2. 在网站抓取反馈页面中禁止百度抓取:yu 抓取反馈页面 -> 新建反馈 -> 选择不抓取,并选择“所有搜索引擎” 3. 使用noindex标签,添加noindex标签meta可以明确地告知搜索引擎不抓取你的页面:

Public @ 2023-03-03 21:00:13

搜索引擎是什么

所谓搜索引擎,就是根据用户需求与一定算法,运用特定策略从互联网检索出制定信息反馈给用户的一门检索技术。搜索引擎依托于多种技术,如网络爬虫技术、检索排序技术、网页处理技术、大数据处理技术、自然语言处理技术等,为信息检索用户提供快速、高相关性的信息服务。搜索引擎技术的核心模块一般包括爬虫、索引、检索和排序等,同时可添加其他一系列辅助模块,以为用户创造更好的网络使用环境。

Public @ 2011-11-23 16:22:57

搜索引擎面临哪些问题

网页时效性:互联网上的用户众多,数据信息来源极广,互联网上的网页是呈实时动态变化的,网页的更新、删除等变动极为频繁,有时候会出现新更新的网页在爬虫程序还来不及抓取的时候却已经被删除的情况,这将大大影响搜索结果的准确性。  大数据存储问题:爬虫抓取的数据在经过预处理后数据量依然相当庞大,这给大数据存储技术带来相当大的挑战。当前大部分搜索引擎都是利用结构化的数据库来存储数据,结构化的数据库存

Public @ 2013-08-22 16:22:54

更多您感兴趣的搜索

0.419646s