搜索引擎的工作原理及发展历程_搜索引擎的工作原理_报资讯
1、搜索引擎的基本工作原理包括如下三个过程:首先在互联网中发现、搜集网页信息;同时对信息进行提取和组
1、搜索引擎的基本工作原理包括如下三个过程:首先在互联网中发现、搜集网页信息;同时对信息进行提取和组织建立索引库;再由检索器根据用户输入的查询关键字,在索引库中快速检出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并将查询结果返回给用户。
(资料图)
2、 抓取网页。
3、每个独立的搜索引擎都有自己的网页抓取程序爬虫(spider)。
4、爬虫Spider顺着网页中的超链接,从这个网站爬到另一个网站,通过超链接分析连续访问抓取更多网页。
5、被抓取的网页被称之为网页快照。
6、由于互联网中超链接的应用很普遍,理论上,从一定范围的网页出发,就能搜集到绝大多数的网页。
7、 2、处理网页。
8、搜索引擎抓到网页后,还要做大量的预处理工作,才能提供检索服务。
9、其中,最重要的就是提取关键词,建立索引库和索引。
10、其他还包括去除重复网页、分词(中文)、判断网页类型、分析超链接、计算网页的重要度/丰富度等。
11、 3、提供检索服务。
12、用户输入关键词进行检索,搜索引擎从索引数据库中找到匹配该关键词的网页;为了用户便于判断,除了网页标题和URL外,还会提供一段来自网页的摘要以及其他信息。
本文就为大家分享到这里,希望小伙伴们会喜欢。
责任编辑:hf009
免责声明:本文仅代表作者个人观点,与柘城网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
如有问题,请联系我们!
- 搜索引擎的工作原理及发展历程_搜索引擎的2023-05-14
- 现代因果实录一二三_现代因果实录全集|当前2023-05-14
- 联想笔记本怎么调亮度(联想笔记本怎么调亮2023-05-14
- 怎么设置手机闹铃时间和铃声 手机响铃时间2023-05-14
- 花游世界杯埃及站:16岁小将杨顺诚男单项目2023-05-14
- 【世界聚看点】昆剧表演艺术家程伟兵去世,2023-05-14
- 世界最新:古人用乌鸦反哺比喻什么 羊有跪2023-05-14
- 【独家焦点】孕妇药物引产的详细过程2023-05-14
- 观察:汇中股份: 关于召开2022年年度股东2023-05-14
- 新亚强: 第三届董事会第八次会议决议公告_2023-05-14
- fastfoodapp fastfood2023-05-14
- 铭铭大魔王双人 铭铭大魔王 全球通讯2023-05-14
- 记者:米兰有意库卢塞夫斯基和阿森西奥,热2023-05-14
- 世界今日报丨剧本敢这么写?保级狂魔埃弗顿2023-05-14
- 团建溺亡女子家属发声2023-05-14
- 运输无根小葱被收费?司机回应2023-05-14
- 美联储:资产负债表存在大量浮亏 美700多2023-05-14
- 焦点短讯!大公司创新情报(5月14日):注2023-05-14
- 【母亲节特辑】检察干警眼中母亲的模样2023-05-14
- 散文名家眼中的商洛|叶梅:商洛为散文写作2023-05-14
- ISG深圳国际创投节闭幕 粤港澳大湾区创业2023-05-14
- 全国首个珊瑚主题国家级海洋牧场落户南澳 2023-05-14
- 2022年四川省十大民营企业社会责任优秀案例2023-05-14
- 环球快资讯:从“开发强度之首”到“水质改2023-05-14
- 切实保障快递员合法权益 促进快递业持续健2023-05-14
- 4月份全国新办涉税经营主体同比增长28.8% 2023-05-14
- 最新:丧网名女_丧女漫画2023-05-14
- 小农意识的女人十个表现_小农意识2023-05-14
- 报考注会需要哪些条件_报考注会需要什么条2023-05-14
- 每日消息!江小白营销案例启示_江小白营销案2023-05-14