我正在开发一个具有以下结构的网站:
<body>
<section>
<sub-section>
Content 1
</sub-section>
<sub-section>
Content 2
</sub-section>
</section>
<section>
<sub-section>
Content 3
</sub-section>
<sub-section>
Content 4
</sub-section>
</section>
</body>
页面加载后,所有部分都由ajax加载。该网站有两种语言,因此如果用户决定切换语言,所有部分都会再次加载,但使用不同的语言。
目标是让谷歌爬虫将每个部分索引为不同的页面。
到目前为止,我的方法如下:
每个部分都有元数据:关键字、标题等。当用户键入:mysite.com/section_name时,页面将加载所需部分的元数据。
问题是,当谷歌抓取时,它会发现每个不同的页面都有不同的元数据值,但有相同的html结构。
你对如何解决这个问题有什么建议吗?
谢谢!
以下是一些链接,可以帮助您了解创建HTML快照的主题。
https://developers.google.com/webmasters/ajax-crawling/
https://support.google.com/webmasters/answer/174992
用于爬网程序的HTML快照-了解其工作方式