站内搜索结果页通常长这样:?s=关键词/search/关键词。它对用户是工具,但对搜索引擎来说几乎都是低价值:内容重复、URL 数量无限、还容易被垃圾词污染。

所以大多数外贸站的最佳实践是:站内搜索页 noindex,同时确保 sitemap 不提交它。

Google Search Central:noindex 相关说明页面

图:Google 官方文档里的 noindex 说明。理解“让页面不收录”与 robots 屏蔽的区别很重要。

为什么站内搜索页几乎不该收录?

  • 它只是文章列表的另一种排列(重复度极高)
  • 任何词都能生成一个新 URL(数量无限)
  • 很容易形成薄内容/软 404 信号
  • 被 spam 访问时,搜索词会很脏,拖累站点质量

noindex vs Disallow:别混用

  • noindex:允许抓取,但告诉搜索引擎“不收录”。
  • Disallow(robots.txt):阻止抓取,但不等于一定不收录,且会让搜索引擎无法更新页面状态。

外贸站常见做法:搜索页用 noindex + sitemap 不提交;robots.txt 不要乱封。

怎么设置(Rank Math / Yoast 思路一致)

你要做的不是找某个“神秘开关”,而是:

  1. 在 SEO 插件的 Misc/Special pages/Archives 里找到 Search results
  2. 设置为 noindex
  3. 确认 sitemap 不会提交搜索页 URL

怎么验证是否生效?(3 分钟)

  1. 打开任意搜索页(比如 ?s=test
  2. 查看源码,搜索 noindex
  3. 应该能看到 robots meta 含 noindex

如果搜索页已经被收录了怎么办?

别慌,按顺序做:

  1. 先确保现在页面确实 noindex
  2. 确保 sitemap 不再提交搜索页
  3. 等待 1–4 周让索引更新(这是正常时间)

你也可以用 GSC 的 URL Inspection 请求重新抓取,但是否移除由 Google 决定。

下一步建议:把标签/分类等系统页也按策略控制收录,避免膨胀:标签/分类收录策略