百度搜索引擎工作原理-3-检索排序_威海佰年网络技术有限公司_网站建设_软件开发_私有云_商标注册_公众号_小程序_APP_物联网_ChatGPT

Categories

Tags

百度搜索引擎工作原理-3-检索排序

检索排序是指根据用户查询的关键词和相关度分数对文档进行排序，以便在搜索结果页面中将最相关和最相关的文档排在前面。百度搜索引擎使用了一种称为PBM（Probabilistic Boolean Model）的检索算法来衡量文档的相关性，以及PageRank算法来确定文档的权重和排名。 PBM算法将计算文档中包含用户搜索查询词的概率，并以此计算文档的相关度得分。这个概率是通过使用贝叶斯公式结合词频率、文档频率和词群的概率来计算的。这意味着，一个文档所包含的搜索查询词的数量越多，它被认为越相关。 PageRank算法是另一种重要的排序算法，它考虑到链接结构对文档的权重和排名的影响。它衡量文档的权重，称为PageRank值。该算法基于一个假设，即一个页面的排名与被链接到的其他页面数量有关。如果一个页面被很多其他页面链接，那么它被认为是更重要的，并被分配更高的PageRank值。通过使用这些算法，百度搜索引擎可以根据用户查询和文档相关性对搜索结果进行排序，并显示最相关的文档在搜索结果页面的顶部。

Public @ 2023-06-16 04:00:39

百度搜索引擎工作原理-5-结果展现

结构化数据——助力站点获得更多点击网页经历了抓取建库，参与了排序计算，最终展现在搜索引擎用户面前。目前在百度搜索左侧结果展现形式很多，如：凤巢、品牌专区、自然结果等，一条自然结果怎样才能获得更多的点击，是站长要考虑的重要一环。目前自然结果里又分为两类，见下图，第一个，即结构化展现，形式比较多样。目前覆盖80%的搜索需求，即80%的关键词下会出现这种复杂展现样式；第二个即一段摘要式展现，最原始的展现

Public @ 2021-09-11 16:21:45

百度搜索引擎工作原理

百度搜索引擎工作原理大致如下： 1. 爬虫抓取网页：百度的爬虫程序会从互联网抓取网页并将其存入数据库中。 2. 预处理：百度对所有网页进行预处理，这个过程会去除无用信息、提取关键词、计算每个网页的PageRank等。 3. 查询处理：当用户输入关键词进行搜索时，百度会将查询处理成一组词条，并进行分类别处理，比如确定搜索意图是找资讯、图片、视频等。 4. 检索匹配：百度搜索引擎会对数据库中的

Public @ 2023-06-20 19:50:19

百度搜索引擎工作原理

最新更新章节：2019-03-04关于百度以及其它搜索引擎的工作原理，其实大家已经讨论过很多，但随着科技的进步、互联网业的发展，各家搜索引擎都发生着巨大的变化，并且这些变化都是飞快的。我们设计这个章节的目的，除了从官方的角度发出一些声音、纠正一些之前的误读外，还希望通过不断更新内容，与百度搜索引擎发展保持同步，给各位站长带来最新的、与百度高相关的信息。本章主要内容分为四个章节，分别为：抓取建库；检

Public @ 2014-04-22 16:21:48

百度搜索引擎工作原理-3-检索排序

检索排序是百度搜索引擎中的一个重要环节，它决定了搜索结果的排序方式，确保用户能够获得最相关、最有用的搜索结果。百度搜索引擎的检索排序主要分为两个阶段：候选集生成和排序打分。 1. 候选集生成：在这一阶段，百度搜索引擎首先通过用户输入的关键词进行网页索引的初步筛选，选取与关键词相关的网页进行后续处理。百度搜索引擎通过倒排索引技术，将海量的网页按关键词进行索引，以加快搜索速度和提高搜索结果的相关

Public @ 2023-07-24 20:00:45

更多您感兴趣的搜索

基本文件流程错误 SQL 调试

/www/wwwroot/bninc.cn/public/index.php ( 0.79 KB )
/www/wwwroot/bninc.cn/public/public.php ( 1.08 KB )
/www/wwwroot/bninc.cn/thinkphp/start.php ( 0.73 KB )
/www/wwwroot/bninc.cn/thinkphp/base.php ( 2.66 KB )
/www/wwwroot/bninc.cn/thinkphp/library/think/Loader.php ( 19.47 KB )
/www/wwwroot/bninc.cn/vendor/composer/autoload_namespaces.php ( 0.21 KB )
/www/wwwroot/bninc.cn/vendor/composer/autoload_psr4.php ( 0.84 KB )
/www/wwwroot/bninc.cn/vendor/composer/autoload_classmap.php ( 0.14 KB )
/www/wwwroot/bninc.cn/vendor/composer/autoload_files.php ( 0.42 KB )
/www/wwwroot/bninc.cn/vendor/qiniu/php-sdk/src/Qiniu/functions.php ( 7.10 KB )
/www/wwwroot/bninc.cn/vendor/qiniu/php-sdk/src/Qiniu/Config.php ( 0.70 KB )
/www/wwwroot/bninc.cn/vendor/topthink/think-captcha/src/helper.php ( 1.59 KB )
/www/wwwroot/bninc.cn/thinkphp/library/think/Route.php ( 59.82 KB )
/www/wwwroot/bninc.cn/thinkphp/library/think/Config.php ( 6.03 KB )
/www/wwwroot/bninc.cn/thinkphp/library/think/Validate.php ( 40.27 KB )
/www/wwwroot/bninc.cn/vendor/topthink/think-queue/src/config.php ( 0.77 KB )
/www/wwwroot/bninc.cn/thinkphp/library/think/Console.php ( 21.22 KB )
/www/wwwroot/bninc.cn/thinkphp/library/think/Error.php ( 3.59 KB )
/www/wwwroot/bninc.cn/thinkphp/convention.php ( 10.31 KB )
/www/wwwroot/bninc.cn/thinkphp/library/think/App.php ( 21.04 KB )
/www/wwwroot/bninc.cn/thinkphp/library/think/Request.php ( 50.94 KB )
/www/wwwroot/bninc.cn/app/config.php ( 11.25 KB )
/www/wwwroot/bninc.cn/app/database.php ( 1.41 KB )
/www/wwwroot/bninc.cn/thinkphp/library/think/Hook.php ( 4.76 KB )
/www/wwwroot/bninc.cn/app/tags.php ( 1.16 KB )
/www/wwwroot/bninc.cn/app/common/behavior/InitBase.php ( 8.17 KB )
/www/wwwroot/bninc.cn/app/common.php ( 23.29 KB )
/www/wwwroot/bninc.cn/thinkphp/library/think/Env.php ( 1.25 KB )
/www/wwwroot/bninc.cn/thinkphp/helper.php ( 17.86 KB )
/www/wwwroot/bninc.cn/app/function.php ( 0.78 KB )
/www/wwwroot/bninc.cn/app/extend.php ( 13.29 KB )
/www/wwwroot/bninc.cn/thinkphp/library/think/Debug.php ( 7.06 KB )
/www/wwwroot/bninc.cn/app/common/model/Config.php ( 0.78 KB )
/www/wwwroot/bninc.cn/app/common/model/ModelBase.php ( 12.18 KB )
/www/wwwroot/bninc.cn/thinkphp/library/think/Model.php ( 66.83 KB )
/www/wwwroot/bninc.cn/thinkphp/library/think/Db.php ( 6.54 KB )
/www/wwwroot/bninc.cn/thinkphp/library/think/Log.php ( 5.84 KB )
/www/wwwroot/bninc.cn/thinkphp/library/think/db/connector/Mysql.php ( 3.94 KB )
/www/wwwroot/bninc.cn/thinkphp/library/think/db/Connection.php ( 29.97 KB )
/www/wwwroot/bninc.cn/thinkphp/library/think/db/Query.php ( 86.80 KB )
/www/wwwroot/bninc.cn/thinkphp/library/think/db/builder/Mysql.php ( 2.16 KB )
/www/wwwroot/bninc.cn/thinkphp/library/think/db/Builder.php ( 30.47 KB )
/www/wwwroot/bninc.cn/thinkphp/library/think/Cache.php ( 6.17 KB )
/www/wwwroot/bninc.cn/thinkphp/library/think/cache/driver/File.php ( 7.46 KB )
/www/wwwroot/bninc.cn/thinkphp/library/think/cache/Driver.php ( 5.52 KB )
/www/wwwroot/bninc.cn/app/common/behavior/InitHook.php ( 1.25 KB )
/www/wwwroot/bninc.cn/app/common/model/Hook.php ( 0.77 KB )
/www/wwwroot/bninc.cn/thinkphp/library/think/Lang.php ( 6.95 KB )
/www/wwwroot/bninc.cn/thinkphp/lang/zh-cn.php ( 3.85 KB )
/www/wwwroot/bninc.cn/app/route.php ( 0.91 KB )
/www/wwwroot/bninc.cn/app/index/config.php ( 0.96 KB )
/www/wwwroot/bninc.cn/app/index/common.php ( 0.68 KB )
/www/wwwroot/bninc.cn/app/index/controller/Wiki.php ( 2.44 KB )
/www/wwwroot/bninc.cn/app/index/controller/IndexBase.php ( 1.10 KB )
/www/wwwroot/bninc.cn/app/common/controller/ControllerBase.php ( 4.75 KB )
/www/wwwroot/bninc.cn/thinkphp/library/think/Controller.php ( 6.20 KB )
/www/wwwroot/bninc.cn/thinkphp/library/traits/controller/Jump.php ( 4.97 KB )
/www/wwwroot/bninc.cn/thinkphp/library/think/View.php ( 6.86 KB )
/www/wwwroot/bninc.cn/thinkphp/library/think/view/driver/Think.php ( 5.61 KB )
/www/wwwroot/bninc.cn/thinkphp/library/think/Template.php ( 46.46 KB )
/www/wwwroot/bninc.cn/thinkphp/library/think/template/driver/File.php ( 2.24 KB )
/www/wwwroot/bninc.cn/app/index/logic/Wiki.php ( 6.16 KB )
/www/wwwroot/bninc.cn/app/index/logic/IndexBase.php ( 0.79 KB )
/www/wwwroot/bninc.cn/app/common/logic/LogicBase.php ( 0.83 KB )
/www/wwwroot/bninc.cn/app/common/model/Article.php ( 0.78 KB )
/www/wwwroot/bninc.cn/app/common/model/ArticleTongji.php ( 0.79 KB )
/www/wwwroot/bninc.cn/thinkphp/library/think/paginator/driver/Bootstrap.php ( 5.90 KB )
/www/wwwroot/bninc.cn/thinkphp/library/think/Paginator.php ( 9.45 KB )
/www/wwwroot/bninc.cn/thinkphp/library/think/Collection.php ( 8.63 KB )
/www/wwwroot/bninc.cn/runtime/temp/fd12b1d7af823e9ae53201dacc6a6621.php ( 56.49 KB )
/www/wwwroot/bninc.cn/thinkphp/library/think/Response.php ( 8.64 KB )
/www/wwwroot/bninc.cn/thinkphp/library/think/debug/Html.php ( 4.27 KB )

[ DB ] CONNECT:[ UseTime:0.023134s ] mysql:dbname=briline.net;host=106.14.77.182;port=3306;charset=utf8
[ SQL ] SHOW COLUMNS FROM `ob_article` [ RunTime:0.017016s ]
[ SQL ] SELECT * FROM `ob_article` WHERE `id` = 8981 LIMIT 1 [ RunTime:0.015653s ]
[ EXPLAIN : array ( 'id' => 1, 'select_type' => 'SIMPLE', 'table' => 'ob_article', 'type' => 'const', 'possible_keys' => 'PRIMARY', 'key' => 'PRIMARY', 'key_len' => '4', 'ref' => 'const', 'rows' => 1, 'extra' => NULL, ) ]
[ SQL ] select * from `ob_article_tongji` where category_id=12 and mark_type='cate' order by times desc limit 15 [ RunTime:0.015792s ]
[ EXPLAIN : array ( 'id' => 1, 'select_type' => 'SIMPLE', 'table' => 'ob_article_tongji', 'type' => 'ALL', 'possible_keys' => NULL, 'key' => NULL, 'key_len' => NULL, 'ref' => NULL, 'rows' => 608, 'extra' => 'Using where; Using filesort', ) ]
[ SQL ] select * from `ob_article_tongji` where category_id=12 and mark_type='tags' order by times desc limit 100 [ RunTime:0.016149s ]
[ EXPLAIN : array ( 'id' => 1, 'select_type' => 'SIMPLE', 'table' => 'ob_article_tongji', 'type' => 'ALL', 'possible_keys' => NULL, 'key' => NULL, 'key_len' => NULL, 'ref' => NULL, 'rows' => 608, 'extra' => 'Using where; Using filesort', ) ]
[ SQL ] select * from `ob_article_tongji` where category_id=12 and mark_type='tags' order by rand() limit 30 [ RunTime:0.016846s ]
[ EXPLAIN : array ( 'id' => 1, 'select_type' => 'SIMPLE', 'table' => 'ob_article_tongji', 'type' => 'ALL', 'possible_keys' => NULL, 'key' => NULL, 'key_len' => NULL, 'ref' => NULL, 'rows' => 608, 'extra' => 'Using where; Using temporary; Using filesort', ) ]
[ SQL ] SELECT * FROM `ob_article` WHERE `id` = 8981 LIMIT 1 [ RunTime:0.015640s ]
[ EXPLAIN : array ( 'id' => 1, 'select_type' => 'SIMPLE', 'table' => 'ob_article', 'type' => 'const', 'possible_keys' => 'PRIMARY', 'key' => 'PRIMARY', 'key_len' => '4', 'ref' => 'const', 'rows' => 1, 'extra' => NULL, ) ]
[ SQL ] update `ob_article` set views=views+1 where id=8981 [ RunTime:0.016279s ]
[ SQL ] SELECT COUNT(*) AS tp_count FROM `ob_article` WHERE `category_id` = 12 AND `cate` = '威海搜索引擎工作原理' AND `status` <> -1 LIMIT 1 [ RunTime:0.022687s ]
[ EXPLAIN : array ( 'id' => 1, 'select_type' => 'SIMPLE', 'table' => 'ob_article', 'type' => 'ALL', 'possible_keys' => NULL, 'key' => NULL, 'key_len' => NULL, 'ref' => NULL, 'rows' => 9562, 'extra' => 'Using where', ) ]
[ SQL ] SELECT * FROM `ob_article` WHERE `category_id` = 12 AND `cate` = '威海搜索引擎工作原理' AND `status` <> -1 ORDER BY rand() LIMIT 0,2 [ RunTime:0.031950s ]
[ EXPLAIN : array ( 'id' => 1, 'select_type' => 'SIMPLE', 'table' => 'ob_article', 'type' => 'ALL', 'possible_keys' => NULL, 'key' => NULL, 'key_len' => NULL, 'ref' => NULL, 'rows' => 9562, 'extra' => 'Using where; Using temporary; Using filesort', ) ]
[ SQL ] SELECT COUNT(*) AS tp_count FROM `ob_article` WHERE `category_id` = 12 AND `tags` = '威海百度搜索引擎工作原理（百度搜索资源平台）' AND `status` <> -1 LIMIT 1 [ RunTime:0.023493s ]
[ EXPLAIN : array ( 'id' => 1, 'select_type' => 'SIMPLE', 'table' => 'ob_article', 'type' => 'ALL', 'possible_keys' => NULL, 'key' => NULL, 'key_len' => NULL, 'ref' => NULL, 'rows' => 9562, 'extra' => 'Using where', ) ]
[ SQL ] SELECT * FROM `ob_article` WHERE `category_id` = 12 AND `tags` = '威海百度搜索引擎工作原理（百度搜索资源平台）' AND `status` <> -1 ORDER BY rand() LIMIT 0,2 [ RunTime:0.031510s ]
[ EXPLAIN : array ( 'id' => 1, 'select_type' => 'SIMPLE', 'table' => 'ob_article', 'type' => 'ALL', 'possible_keys' => NULL, 'key' => NULL, 'key_len' => NULL, 'ref' => NULL, 'rows' => 9562, 'extra' => 'Using where; Using temporary; Using filesort', ) ]

0.443153s

ShowPageTrace