98堂地址入口

编辑导读:我们每天都在用的 在线免费高清.在线免费观看 ,看似简单,其实背后的技术细节非常复杂。本文将从六个方面分析 在线免费高清.在线免费观看 是如何工作的,希望对你有帮助。

98堂地址入口

我们每天都在用 Google, 百度这些在线免费高清.在线免费观看,那大家有没想过在线免费高清.在线免费观看是如何实现的呢?看似简单的搜索其实技术细节非常复杂,说在线免费高清.在线免费观看是 IT 皇冠上的明珠也不为过,今天我们来就来简单看一下在线免费高清.在线免费观看的原理,看看它是如何工作的。

网页抓取:在线免费高清.在线免费观看通过爬虫将网页爬取,获得页面 HTML 代码存入数据库中。预处理:索引程序对抓取来的页面数据进行文字提取,中文分词,(倒排)索引等处理,以备排名程序使用。排序:排名程序调用索引数据库数据,计算网页的相关性。其中最著名的是Google在线免费高清.在线免费观看的核心排序算法:PageRank。查询:用户输入关键词后,首先肯定是要经过分词器的处理。比如我输入「中国人民」,假设分词器分将其分为「中国」,「人民」两个词,接下来就用这个两词去倒排索引里查相应的文档。

我们重点来看一下第一步:网页抓取。

这一步的大致操作如下:给爬虫分配一组起始的网页,我们知道网页里其实也包含了很多超链接,爬虫爬取一个网页后,解析提取出这个网页里的所有超链接,再依次爬取出这些超链接,再提取网页超链接。如此不断重复就能不断根据超链接提取网页。

如下图示:

98堂地址入口

如上所示,最终构成了一张图,于是问题就转化为了如何遍历这张图。

98堂地址入口地址发布页

从已给的连通图中某一顶点出发,沿着一些边访遍图中所有的顶点,且使每个顶点仅被访问一次,就叫做图的遍历,它是图的基本运算。

遍历的实质是找每个顶点的连接点的过程。

图的特点:图中可能存在回路,且图的任一顶点都可能与其他顶点想通,在访问完某个顶点之后可能会沿着某些边又回到了曾经访问过的顶点。

以逛公园为例,从公园入口v1出发,如何用最短的路程逛完公园全部7个景点,这就是一个典型的图的遍历。

98堂地址入口

图常用的遍历方法有两种:

深度优先搜索(Depth_First Search——DFS)广度优先搜索(Breadth_First Search——BFS)

98堂地址入口影视app

以经典的迷宫图来看看如何遍历。

题目:如何从迷宫入口出发,点亮迷宫中所有的灯?

98堂地址入口

步骤一:从顶点(迷宫入口)开始遍历,它相邻的顶点有向右和向下的两盏灯,我们随机选择向右的那盏灯并将其点亮。

98堂地址入口

步骤二:以点亮后的这盏灯为顶点继续遍历。它相邻的顶点有两个:入口的灯和右下角的灯,由于入口的灯已点亮,我们只能点亮右下角的那盏灯。

98堂地址入口

步骤三:重复以上步骤,以被点亮的灯为顶点继续遍历,直至这条路走不通为止,用通俗的话来说就是“把一条路走到黑”。如下图:

98堂地址入口

步骤四:无路可走后,沿着原路返回,继续寻找没有被点亮的灯,直至把所有的灯全部点亮。至此,我们完整地实现了深度优先搜索。如下图:

98堂地址入口

总结:

深度优先搜索的主要思路是:从图中一个未访问的顶点 V 开始,沿着一条路一直走到底,然后从这条路尽头的节点回退到上一个节点,再从另一条路开始走到底……

不断递归重复此过程,直到所有的顶点都遍历完成,它的特点是不撞南墙不回头,先走完一条路,再换一条路继续走。

98堂地址入口福利社入口

题目:如何从入口1出发,遍历整颗树?

98堂地址入口

步骤一:先遍历节点1的所有节点——2,3,4。

步骤二:再分别遍历节点2,3,4的所有节点——5,6,7,8。

步骤三:再分别遍历节点5,6,7,8的所有节点——9,10。

98堂地址入口

总结:

具体思想:从图中某顶点1出发,在访问了1之后依次访问1的各个未曾访问过的邻接点,然后分别从这些邻接点出发依次访问它们的邻接点,并使得“先被访问的顶点的邻接点先于后被访问的顶点的邻接点被访问”,直至图中所有已被访问的顶点的邻接点都被访问到。如果此时图中尚有顶点未被访问,则需要另选一个未曾被访问过的顶点作为新的起始点,重复上述过程,直至图中所有顶点都被访问到为止。

简单来说,广度优先遍历,指的是从图的一个未遍历的节点出发,先遍历这个节点的相邻节点,再依次遍历每个相邻节点的相邻节点。

所以广度优先遍历也叫层序遍历,先遍历第一层(节点 1),再遍历第二层(节点 2,3,4),第三层(5,6,7,8),第四层(9,10)。

98tang99久久亚洲

栈是一种只能从表的一端存取数据且遵循 “先进后出” 原则的线性存储结构。

例如,我们经常使用浏览器在各种网站上查找信息。假设先浏览的页面 A,然后关闭了页面 A 跳转到页面 B,随后又关闭页面 B 跳转到了页面 C。而此时,我们如果想重新回到页面 A,有两个选择:

重新搜索找到页面 A;使用浏览器的”回退”功能。浏览器会先回退到页面 B,而后再回退到页面 A。

而浏览器 “回退” 功能的实现,底层使用的就是栈存储结构。

98堂地址入口

98tang九一九色国产

与栈结构不同的是,队列的两端都”开口”,要求数据只能从一端进,从另一端出。队列中数据的进出要遵循 “先进先出” 的原则,即最先进队列的数据元素,同样要最先出队列。

队列的应用也很广泛,只要满足“先来先服务”特性的应用均可采用队列作为其数据组织方式。例如在多用户系统中,多个用户排成队,分时地循环使用CPU和主存。

栈和队列在图的遍历中的应用:

深度优先搜索由于是先入后出的算法,使用栈来实现。而广度优先搜索是先入先出的算法,使用队列实现。

以二叉树为例来看下如何用栈来实现 DFS。

98堂地址入口

同样以以上图二叉树为例来看看如何用队列来实现广度优先遍历。

98堂地址入口

98堂地址入口地址发布页

回到开篇提到的在线免费高清.在线免费观看,我们来继续看看网页抓取的大致思路。

如果是广度优先遍历:先依次爬取第一层的起始网页,再依次爬取每个网页里的超链接。

如果是深度优先遍历:先爬取起始网页 1,再爬取此网页里的链接,爬取完之后,再爬取起始网页 2。

实际上爬虫是深度优先与广度优先两种策略一起用的,比如在起始网页里,有些网页比较重要(权重较高),那就先对这个网页做深度优先遍历,遍历完之后再对其他(权重一样的)起始网页做广度优先遍历。

本文由 @CARRIE 原创发布于98tang。未经许可,禁止转载

题图来自Unsplash,基于CC0协议

本文来自投稿,不代表【】观点,发布者:【

本文地址: ,如若转载,请注明出处!

举报投诉邮箱:[email protected]

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 202在线免费高清.在线免费观看11月15日 下午7:09
下一篇 202在线免费高清.在线免费观看11月15日 下午7:10

98tang99久久亚洲

  • 98tang最新网址

    PetalBot 是 Petal 在线免费高清.在线免费观看(华为花瓣在线免费高清.在线免费观看)的自动程序。PetalBot 的功能是访问 PC 网站和移动网站,并建立索引数据库,使用户可以在 Petal 在线免费高清.在线免费观看中搜索您网站的内容。 PetalBot 是 Petal 在线免费高清.在线免费观看(华为花瓣在线免费高清.在线免费观看)的自动程序。PetalBot 的功能是访问 PC 网站和移动网站,并建立索引数据库,使用户可以在…

    202在线免费高清.在线免费观看12月28日
    22 0 0
  • 98堂地址入口

    现在我们的生活是离不开口罩的,平时外出或者自己生病的时候都是可以戴口罩的。有的人因此开始喜欢囤口罩,甚至买好几箱,一两年都用不完。但其实口罩不要囤积的太多,不然不小心过期了,效果也是大打折扣了。那么口罩放了三年还能用吗? 98堂地址入口 口罩的有效期一般是2~在线免费高清.在线免费观看,所以放了在线免费高清.在线免费观看时间的口罩,很大情况下是不能使用的。 口罩外包装上会有有效期,如果已经超过标…

    202在线免费高清.在线免费观看12月27日 用户投稿
    29 0 0
  • 98堂地址入口国 产一区二区久久

    工作的概念是劳动生产。主要是指劳动。工作是在长时间内,做着重复的一系列动作,做重复的一系列事情,工作就是在长时间内做重复的动作。通过工作来产生价值,通过工作换取一些物质,通过工作来寻找生活的目标。工作也是我们生活不可缺少的。 工作的概念是劳动生产。主要是指劳动。生产是可以创造价值;而劳动可以创造价值,也可以不创造价值,如无用功。工作:是在长时间内,做着重复的…

    202在线免费高清.在线免费观看12月25日
    26 0 0
  • 98tang最新网址

    花瓣搜索(Petal Search)是一个搜索应用程序。由位于爱尔兰的华为子公司建造。可以在网络上搜索图像,视频,新闻和其他内容。也是从非官方来源(如APKMirror和APK)安装应用程序的简便方法。 花瓣搜索(Petal Search)是一个搜索应用程序。它由 Aspiegel Limited(位于爱尔兰的华为子公司)建造。使用它,您可以在网络上搜索图像…

    202在线免费高清.在线免费观看12月19日
    27 0 0
  • 98tang最新网址

    外链就是指在别的网站导入自己网站的链接。导入链接对于网站优化来说是非常重要的一个过程。导入链接的质量(即导入链接所在页面的权重)间接影响了我们的网站在在线免费高清.在线免费观看中的权重。 外链就是指在别的网站导入自己网站的链接。导入链接对于网站优化来说是非常重要的一个过程。导入链接的质量(即导入链接所在页面的权重)间接影响了我们的网站在在线免费高清.在线免费观看中的权重。 外链是互联网的血液,…

    202在线免费高清.在线免费观看12月14日
    20 0 0
  • 98tang九一九色国产

    404页面是客户端在浏览网页时,服务器无法正常提供信息,或是服务器无法回应,且不知道原因所返回的页面。 404 页面是客户端在浏览网页时,服务器无法正常提供信息,或是服务器无法回应,且不知道原因所返回的页面。 据说在第三次科技革命之前,互联网的形态就是一个大型的中央数据库,这个数据库就设置在 404 房间里面。那时候所有的请求都是由人工手动完成的,如果在数据…

    202在线免费高清.在线免费观看12月14日
    20 0 0
  • 98堂地址入口福利社入口

    神马搜索平台是针对移动终端的在线免费高清.在线免费观看平台。目前神马搜索移动端市场份额大约在13.35%,仅次与百度移动端搜索的79.61%,第三是搜狗移动端搜索5.8%。所以神马搜索的增长势头不错,有望在未来占据移动端sem营销推广市场更大的份额。 神马搜索竞价推广是依附在 UC 浏览器内的新搜索平台。所以神马搜索平台是针对移动终端的在线免费高清.在线免费观看平台。目前神马搜索移动端市场份额…

    202在线免费高清.在线免费观看12月13日
    25 0 0
  • 98tang

    搜索框联想词是当关键词在一定的时间被频繁搜索,会被判定为受到用户更多需求的行为,在线免费高清.在线免费观看会根据用户搜索的时候给到下拉度的联想推荐。 搜索框联想词是当关键词在一定的时间被频繁搜索,会被判定为受到用户更多需求的行为,在线免费高清.在线免费观看会根据用户搜索的时候给到下拉度的联想推荐。 通俗的说就是在百度、360 等在线免费高清.在线免费观看输入一个字或者词的时候就会向下显示出很多的包含这个字词的长…

    202在线免费高清.在线免费观看12月12日
    34 0 0
  • 98tang九一九色国产

    在线免费高清.在线免费观看下拉词(推荐词)是百度、360、搜狗等在线免费高清.在线免费观看为了让网民输入更少的字,看到更多的与搜索词相关的推荐词,这是一个很人性化的服务,深受网民喜爱。 下拉词又称推荐词。以百度为例,百度下拉词是百度为了方便用户搜索而提供的一种关键词联想服务,提高了用户搜索效率。大部分人在搜索某一个关键词其实时并不知道该如何组织语言才能更加精确的达到搜索的目的,而百度下拉词就是…

    202在线免费高清.在线免费观看12月12日
    23 0 0
  • 98堂地址入口影视app

    降权一般是指在线免费高清.在线免费观看给网站评定的级别下降,也是在线免费高清.在线免费观看对网站进行的一种处罚方式。 降权是一个汉语词汇,拼音是 jiàng quán。一般是指在线免费高清.在线免费观看给网站评定的级别下降,也是在线免费高清.在线免费观看对网站进行的一种处罚方式。 定义 利用在线免费高清.在线免费观看策略缺陷,以恶意手段获取与网页质量不符排名,而引发搜索结果和用户体验下降的行为都会被在线免费高清.在线免费观看视为作弊行为。作弊应为按照“轻者轻罚,重…

    202在线免费高清.在线免费观看12月8日
    26 0 0



微信客服