Google 搜索的运作方式

  • A+
所属分类:聚合阅读

了解 Google 如何寻找、检索并提供网页Google 的运作方式是什么?Google 会在不同地区取得各种资讯,包括:
—网页
—使用者提交的内容 (例如使用者在 Google 我的商家和 Google 我的地图中提交的资料)
—书籍扫描
—网际网路上的公开资料库
—以及许多其他来源
不过,本文说明将以网页为主,Google 会依照三个基本步骤产生网页搜寻结果:

检索

检索是指 Googlebot 发现可加入 Google 索引中的新网页或更新网页的程序。我们使用大量电脑来抓取 (也就是「检索」) 网路上数十亿的网页。用来抓取网页的程式名为 Googlebot (又称为漫游器或自动寻检程式)。Googlebot 会使用一种演算程序,由电脑程式决定要检索的网站、检索频率,以及要从每个网站抓取的网页数量。

Google 一开始会根据先前的检索程序所产生的网页网址清单,再结合网站管理员所提供的 Sitemap 资料,逐一检索各个网页。Googlebot 造访这些网站时,会侦测每个网页内的连结,并将这些连结新增到要检索的网页清单;任何新网站、现有网站的变更和无效连结都会被记录下来,并用来更新 Google 的索引资料。
Google 如何找到网页?
Google 利用许多技术来寻找网页,包括:
—追踪其他网站或网页的连结
—读取 Sitemap
Google 如何得知不要检索哪些网页?
—遭到 robots.txt 封锁的网页不会列入检索范围,但如果该网页连结至其他网页,则 Google 仍可能会为其建立索引 (Google 可根据指向网页的连结来推断网页内容,而且无须剖析网页内容即可为其建立索引)。
—Google 无法检索任何禁止匿名使用者存取的网页,因此任何登入规定或其他授权保护机制都会使 Google 无法检索网页。
改善检索成效
您可以採用下列做法协助 Google 找到您网站上的正确网页:
-提交 Sitemap。
-提交检索个别网页的要求。
-使用简单、一目瞭然且符合逻辑的网页网址路径,并在网站中提供清楚直接的内部连结。
-如果您将一篇很长的文章分成几个网页,请明确告知 Google 分页方式。
-如果您在网站中使用网址参数进行导览 (例如在全球购物网站中指明使用者的国家/地区),则务必-使用网址参数工具向 Google 提供这些重要参数。
-谨慎使用 robots.txt:您可使用 robots.txt 向 Google 表明希望 Google 优先解读或检索哪些网页,如此可降低伺服器负载,但请勿用来阻挡 Google 索引显示网页内容。
-使用 hreflang 指向其他语言版本的网页。
-清楚指明您的标准网页和替代网页。
-运用索引涵盖范围报告检视您的检索和索引涵盖范围。

建立索引

Googlebot 会处理检索的每个页面,将各个网页中检索到字词及其位置编译成庞大的索引。此外,我们也会处理包括在关键内容标记和属性 (例如 <title> 标记和 alt 属性) 中的资讯。不过,Googlebot 虽然可以处理多种内容类型,但并未涵盖所有内容类型,比方说某些多媒体档桉的内容就不在 Googlebot 的处理范围之内。

请注意,系统不会检索含有 noindex 指令 (标题或标记) 的网页,但前提是要让检索器发现指令。如果网页只是遭到 robots.txt 档桉、登入页面或其他装置封锁,就算 Google 并未造访该网页,仍可能为其建立索引!
改善索引成效
您可以运用下列做法让 Google 更加瞭解网页内容:
-使用 noindex 防止 Google 检索或找到您想要隐藏的网页。请勿在遭到 robots.txt 封锁的网页上使用「noindex」,这会导致检索器看不到 noindex 指令,所以仍会为该网页建立索引。
-使用结构化资料。
-遵循《Google 网站管理员指南》。
-参阅我们的搜寻引擎最佳化 (SEO) 指南取得更多提示。

传回搜寻结果

使用者输入查询字词时,我们的系统会搜寻索引资料库,并找出符合的网页,再传回我们认为与使用者的查询内容最相关的结果。搜寻关联性取决于 200 多项因素,而且我们仍不断努力改进演算法。Google 会根据使用者体验选择搜寻结果及调整排名,因此请确认您的网页可快速载入并且适合透过行动装置浏览。
改善您的搜寻结果
-如果您的网站是针对特定地区或语言的使用者所设计,请告知 Google 您的目标对象。
-确认您的网页可快速载入而且适合透过行动装置浏览。
-遵循《网站管理员指南》,避免常见错误并改善网站排名。
-考虑为网站实作搜寻结果功能,例如食谱资讯卡或文章资讯卡。
-实作 AMP 可更快速地在行动装置上载入网页。部分 AMP 网页也可以使用焦点新闻轮转介面等其他搜寻功能。
-Google 会持续改进演算法;因此与其尝试猜测演算法规则并据此设计网页,还不如依循我们的规范,用心创造令人耳目一新且切合使用者需求的优质内容。

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: