们的内容,这是一个问题。 让我们继续前进,看看我们可以向客户推荐什么。 问题 3:如果我们确信 Googlebot 没有正确查看我们的内容,我们应该推荐什么? 现在我们知道该域正在使用 JavaScript 加载关键内容,并且我们知道 Googlebot 很可能看不到该内容,最后一步是向客户推荐一个理想的解决方案。关键词:推荐,不实施。我们 100% 的工作是向我们的客户提出问题,解释为什么它很重要(以及可能的影响),并强调一个理想的解决方案。
100% 不是我们的工作,试图完成开发人员的工作,即利用他们独特的堆栈/资源/等找出理想的解决方案。 我们如何做到这一点? 你想要服务器端渲染 谷歌现在无法看到 Sitecore 的登录页面的主要原因是,Sitecore 的登录页面要求用户(我们,Googlebot)完成在 号码表 他们的页面上加载 JavaScript 的繁重工作。换句话说,他们使用的是客户端 JavaScript。 Googlebot 确实是登陆页面,尽可能地执行 JavaScript,然后需要在它有机会看到任何内容之前离开。 此处的解决方法是在其服务器上加载 Sitecore 的登录页面。换言之,我们希望将 Googlebot 的繁重工作从 Sitecore 的服务器上移开。这将确保当 Googlebot 访问页面时,它不必做任何繁重的工作,而是可以抓取呈现的 HTML。
在这种情况下,Googlebot 登陆页面并且已经看到了 HTML(和所有内容)。 还有更具体的选项(如同构设置) 这是杂草丛生的地方,但有混合解决方案。目前最好的称为同构。 在这个模型中,我们要求客户端在他们的服务器上加载第一个请求,然后任何未来的请求都在客户端进行。 因此,Googlebot 来到页面,客户端的服务器已经执行了页面所需的初始 JavaScript,将呈现的 HTML 发送到浏览器,之后的任何事情都在客户端完成。 如果您希望将此作为解决方案推荐,请阅读 AirBNB 团队的这篇文章,其中详细介绍了同构设置。 AJAX 爬取 = 不行 我不会对此进行详细介绍,但只知道Google 之前针对 JavaScript 的 AJAX 抓取解决方案已经停止使用,最终将无法正常工作。我们不应该推荐这种方法。