很多人以为 sitemap 就是“有一个文件”,提交给 Google 就会收录。现实是:sitemap 只是发现入口,它能让 Google 更快知道你有哪些重要页面,但它不能替你保证收录。

外贸站收录慢,最常见的原因反而是:你提交了大量低价值页面、URL 版本混乱(http/https、www/non-www)、站点海外访问不稳、或者核心页面内容太薄。

Google Search Central:站点地图(Sitemap)文档页面

图:Google Search Central 的站点地图说明(sitemap.xml 的作用与基本规则)。

第一步:确认你的 sitemap 到底在哪里

常见地址:

  • Yoast / Rank Math / AIOSEO:/sitemap_index.xml
  • 少数插件或系统:/sitemap.xml

验收:直接用浏览器打开,必须能访问(不是 403/404/无限重定向)。

第二步:别只看“能打开”,要看“包含了什么”

打开 sitemap 后,你至少要检查 4 件事:

  1. 提交的类型对不对:外贸站常见应该包含 Pages(服务页/关于/联系)和 Posts(博客)。
  2. 有没有把垃圾页也提交:站内搜索页、作者页、日期归档、薄标签页。
  3. URL 版本是否统一:全部是 https,且 www/non-www 只用一个。
  4. 核心页是否在里面:你最想成交的服务页必须能在 sitemap 里找到。

如果你发现 sitemap 里塞满了标签页/搜索页,先把收录控制做稳:标签/分类要不要收录搜索页 noindex

第三步:在 Google Search Console(GSC)提交

路径:GSC → 选择你的资源 → Sitemaps → Add a new sitemap。

提交时一般只填路径部分即可:

sitemap_index.xml

如果你用的是 URL Prefix property(不是 Domain),务必确认你选对了版本(https、www/non-www)。

提交后你应该看什么?(很多新手看错重点)

1) Sitemaps:成功 ≠ 收录

Sitemaps 里显示 “Success / Processed” 只表示:Google 能抓到并解析出 URL。后续是否收录要看 Pages 报告。

2) Pages:优先看“核心页”,别被总数带跑偏

外贸站新手最常见误区:天天盯“收录总数”。正确做法是:先把首页/服务页/联系页稳定收录,再扩大到内容。

3) URL Inspection:用来做“抽查验收”

抽查你最重要的服务页:是否允许索引(Indexing allowed)、canonical 是否正确、是否有 noindex。

常见报错与处理(按出现概率排序)

Couldn’t fetch / 403 / 404

  • 先浏览器打开 sitemap,确认可访问
  • 如果用了 Cloudflare/WAF:检查是否把 Googlebot 拦了
  • 检查是否限制地区/强制登录(外贸站有时误配)

Sitemap is HTML(看起来像页面,不是 XML)

常见原因是缓存/重定向把 sitemap 当普通页面处理了。清缓存,并把 sitemap 路径加入缓存排除。

Discovered / Crawled – currently not indexed

这不是“sitemap 坏了”,更像是:Google 觉得暂时没必要收录。解决优先级:

  1. 把页面写更具体(解决一个明确问题,不要泛泛介绍)
  2. 加强内链(首页/专题页/相关文章链接到它)
  3. 减少重复页面(标签/搜索/分页处理好)
  4. 提升可访问性与速度(海外访问不稳会影响抓取)

给新站的“收录启动”方案(你照做就行)

  1. 先保证 5 个核心页:首页 + 3 个服务页 + 联系页。
  2. 写 5 篇长尾文章:每篇解决一个具体问题,并在文末引导到对应服务页。
  3. 首页与导航给核心服务页入口(别藏)。
  4. 提交 sitemap,并对核心页 Request indexing(只是请求,不是保证)。

下一步建议:把内链做成系统,收录会更稳:内链工作流