做外贸 B2B 的人,最常见的困惑不是有没有流量,而是这些流量到底值不值。你可能遇到过:某个国家流量很大,但询盘质量差;某篇文章带来很多访问,但几乎没人联系;广告线索看起来很多,但成交很少。GA4 的界面能看一些趋势,但一旦你想把流量 → 线索 → 成交串到一起,很多时候就会卡在“维度不够”“口径对不上”“数据被聚合了”。

把 GA4 导出到 BigQuery,并不是为了做一个很重的数仓,而是为了拿到事件级原始数据,让你能把不同来源的数据(表单、WhatsApp 点击、邮件点击、CRM 成交)按同一套键串起来。你可以把它当成一条更可靠的数据管道:先把水接出来,再决定要不要做复杂净化。

你真正需要考虑的成本只有 3 个

  1. 存储与查询成本:大多数中小站点的数据量不夸张,成本通常可控;真正容易花钱的是写很重的查询反复跑。
  2. 人力成本:你不需要全职数据工程师,但需要一个能写基础 SQL、懂业务口径的人来做第一次建模。
  3. 口径成本:最贵的不是 BigQuery,而是团队口径不一致导致的报表吵架。所以模型越简单越好。

最小可用数据模型:先把 4 类信息串起来

  • 入口:用户从哪里来(source/medium/campaign,落地页是哪一页)。
  • 行为:他在站内做了什么(浏览了哪些页面、点了哪些 CTA、是否开始填写表单)。
  • 线索:他是否留下了联系方式(表单提交、WhatsApp 点击、邮件点击、电话点击等)。
  • 结果:线索最终是否成交、成交金额与周期(通常在 CRM 里)。

关键点在于:你要给线索一个可以回传的标识(例如表单里的 lead_id、或把 gclid/utm/客户端ID 存进 CRM),这样你才能把后面的成交结果回传并对齐。否则 BigQuery 里再漂亮的事件,也只能停在看热闹。

一条最常用的 SQL 思路:从成交反推“最值得的内容/渠道”

很多人分析顺序是从流量看哪个多,但增长更有效的顺序是从成交反推。你可以先把成交(或高质量线索)拉出来,再看它们最初的入口与内容触点。这样你优化的就不是带来最多访问的页面,而是带来最值钱线索的页面。下面是一段简化思路(示意,不是直接可跑的最终 SQL):

-- 1) 找到发生 lead_submit 的用户/会话
-- 2) 拿到该会话的 first landing page + source/medium
-- 3) 如果有 CRM 回传,再把 lead_id 关联到成交结果
-- 4) 按 landing page / source 聚合出线索数、成交数、成交金额

验收清单:你怎么知道“串起来了”?

  • 你能从 BigQuery 查到一次表单提交对应的落地页与来源。
  • 你能把线索在 CRM 里标记为有效/无效,并用于内部报表。
  • 你能回答一个业务问题:上个月成交的 10 个询盘,最初来自哪些页面/渠道。

如果你目前最大的痛点是线索质量差,建议先把线索事件与质量指标定义清楚:线索质量看板怎么做(思路同样适用于自然流量与多渠道)。