搜索引擎为什么这么快？

如题所述

第1个回答 2022-06-20

速度，是工程和算法的灵魂。速度不仅意味着高效，还能 带给人快感 。

搜索引擎为什么在眨眼之间搜索出结果？

无外乎两个原因：软件快，或者硬件快 。下面将从硬件或者软件两个角度分析这个问题。

CPU最快的操作是位操作，其数学基础是布尔代数。布尔代数对于数学的意义相当于量子力学对物理学的意义，它们将我们对世界的认识从连续状态扩展到离散状态。布尔代数只有或、与、非三个运算，1938年香农大师指出可以使用布尔代数实现开关电路，奠定了数字电路的基础，所有的数学运算都可以转换成二值的布尔运算。人类正是依靠一个个的开关电路才搭建起了电子计算机。

搜索引擎可以分成三个子系统：

其中索引决定了搜索引擎的速度，所以他最基础，也最重要。

最简单的索引实现是一串比特，0表示文档不包含该关键词，1表示包含。比如搜索两个关键词A和B，只需要把A和B对应的索引比特做 与运算 ，就能快速得出同时包含A和B的网页序号。由于二进制的大部分位数都是0，所以只需要记录等于1的位数即可。所以，搜索引擎的索引基于 倒排关键词 实现，是一张大表， 表的每一行是对应一个关键词，后面跟着一组数字 ，是指 包含该关键词的文献序号 。

为了方便排序，索引中还有大量附加信息，比如每个词出现的位置、次数等等，加之网页的数量非常大，所以单台服务器是不可能存储下索引的。怎么解决这个问题呢？

自然是分布式存储。大家不要把分布式看得那么神秘，其实分布式系统对数据的处理只有两个基本招式： 分片，复制 。将索引分成多份（shards）存储到不同的服务器中。

面对大数据的压力，索引也会变得庞大。因此，根据网页的重要性，质量和访问频率来建立常用和不常用等不同级别的索引。常用的索引需要访问速度快，附加信息多，更新也要快，而非常用的索引则没有这么高的要求。

无论搜索引擎的索引在工程上多么复杂，在原理上依然等价于简单的布尔运算。

参考：《数学之美》

扩展：有那么多的网页和关键词，搜索引擎是怎样建索引的？

相似回答

为什么一个搜索引擎在提供给很多人使用时,能有很快的响应速度?答：因为是目录式搜索引擎：以人工方式或半自动方式搜集信息，由编辑员查看信息之后，人工形成信息摘要，并将信息置于事先确定的分类框架中。搜索引擎技术的核心模块一般包括爬虫、索引、检索和排序等，同时可添加其他一系列辅助模块，以为用户创造更好的网络使用环境。

搜索引擎的搜索速度怎么那么快?答：最后，搜索引擎中各网站的有关信息都是从用户网页中自动提取的，所以用户的角度看，我们拥有更多的自主权；而目录索引则要求必须手工另外填写网站信息，而且还有各种各样的限制。更有甚者，如果工作人员认为你提交网站的目录、网站信息不合适，他可以随时对其进行调整，当然事先是不会和你商量的。目录索引...

搜索引擎收录网页为什么那么快呢答：搜索引擎收录网页的快慢与你网站的更新速度、网站访问速度、网站在搜索引擎的权重、网站内容是否有审核等因素都有关系，搜索引擎喜欢收录那些客户客户感兴趣的信息，当然，这些信息要来源于可信的网站。

为什么在网络上搜索信息那么快?答：因为词语的数目比网页的数目要少很多，所以在关键字索引表上找到某个特定的关键字需要花的时间要比扫描所有网页的时间少得多。找到关键字对应的索引之后，搜索引擎就将对应的网页内容显示出来了。总结：在互联网上每天都会出现许许多多的新网页，搜索引擎也会一刻不停地寻找各个网站上有没有新的内容出现，...

百度、Google、搜搜等搜索引擎是怎样工作的?为什么速度这么快?答：这样，搜索引擎根本不用重新翻查它所有保存的信息而迅速找到所要的资料。想象一下，如果信息是不按任何规则地随意堆放在搜索引擎的数据库中，那么它每次找资料都得把整个资料库完全翻查一遍，如此一来再快的计算机系统也没有用。接受查询：用户向搜索引擎发出查询，搜索引擎接受查询并向用户返回资料。搜索...

1.为什么通常使用搜索引擎检索要比使用数据库进行全文检索要快(在线...答：搜索引擎服务器性能好，速度快

大家正在搜

为什么这么快搜狗搜索引擎一天怎么过的这么快资源搜索引擎 360搜索引擎 bt搜索引擎种子搜索引擎这么快就老了这么快就到了