当你的博客/分类页出现分页(/page/2、/page/3),你就进入了“重复 URL 管理”的区域。分页本质是列表页,如果处理不好,会出现:

  • 大量重复页面状态(GSC 里一堆 Duplicate)
  • canonical 指错(指到首页或第一页)
  • 爬虫抓取效率变差(重要页面反而不稳)
Google Search Central:Canonical(规范化)文档页面

图:Google Search Central 的 canonical 规范化说明(理解分页/重复内容很有帮助)。

先说一个稳妥结论(适合大多数外贸站)

  • 分页页允许抓取(帮助发现更深文章)
  • 分页页 canonical自引用(page/2 指向 page/2)
  • 不要一上来把分页全 noindex(除非你非常确定)

3 分钟自检(你现在就能做)

  1. 打开一个分页页:例如 /page/2/
  2. 查看源码,搜索 canonical
  3. canonical 是否指向当前分页页?
  4. 再打开第一页,确认第一页 canonical 指向自己

为什么“分页 canonical 指向第一页”有时会出问题?

很多主题/插件喜欢把分页 canonical 指向第一页,逻辑是“同一列表”。但现实是:

  • 分页 2/3 包含第一页没有的内容入口(对发现内容有价值)
  • canonical 乱指会让 Google 更倾向忽略分页(抓取更浅)
  • 你在 GSC 看到大量重复/未选为规范页,排错成本更高

常见问题与定位方向

分页 canonical 指到首页

优先怀疑:主题 bug 或 SEO/缓存插件冲突。做法:一次只停用一个最近新增的优化插件,找出冲突源。

分页 URL 形式混用(/page/2/ 和 ?paged=2)

这会制造重复 URL。建议统一一种形式,并让 canonical 指向规范形式。

分页被 noindex 了,深层文章不被发现

如果你内容多,分页是发现入口,不建议一刀切 noindex。你可以先把系统页(搜索/薄标签)处理好,优先减少更“垃圾”的重复来源。

验收标准

  • 分页页 canonical 自引用,不乱指首页/第一页
  • 分页 URL 形式统一
  • 搜索页/薄标签页已 noindex(减少无限重复源头)

你如果想把重复页面进一步压下去,建议顺手把搜索页 noindex:搜索页收录怎么控,以及把标签/分类策略做稳:标签/分类要不要收录