
Google Analytics 4(GA4)的数据保留期(Data Retention),是每个账号初始化时最容易被忽视、却影响范围最大的核心配置之一。
GA4 的数据保留期指的是:系统在自动清除用户级和事件级原始数据之前,这些数据在服务器上被保留的时间长度。它影响的是包含 Cookie、用户 ID(User-ID)或广告标识符的细粒度数据,也就是支撑深度分析的“原始明细数据”。
在 GA4 中,标准版的数据保留期最长为 14 个月,GA360 可延长至 50 个月。因此,在账号初始化阶段,建议直接将该设置调整为最长期限。因为一旦超过保留周期,这些数据会被系统自动删除,而且这一过程不可逆、无法恢复。
这些被删除的原始数据恰恰是 GA4 高级分析能力的基础,包括探索(Explore)、路径分析、漏斗分析以及受众构建等功能都依赖这些数据运行。一旦数据缺失,这些分析能力将受到明显限制。
与之不同的是,GA4 标准报告中展示的是已经去除个人标识信息的聚合数据(Aggregated Data),这些数据不会随保留期到期而被删除。这也是为什么很多团队忽视这一设置,是因为在日常使用中几乎感受不到异常。
为什么这个设置经常被忽略?
即使使用默认的2个月保留期,标准报告仍在持续更新,日常优化工作不会受到明显影响。从短期来看,这种差异几乎不可见。
但是当管理层要求进行年度复盘时,当市场团队希望计算用户生命周期价值(LTV)时,或者产品团队需要评估某次版本迭代对长期留存的影响时,分析师才会发现:历史数据已经不完整,甚至已经被系统永久删除。
需要特别强调的是,数据保留期的调整不具备回溯能力。如果账户在过去长期使用默认的2个月保留期,那么这段时间内被删除的数据,不会因为后来调整为 14 个月而恢复,新的设置只会作用于之后产生的数据。
数据保留期设置路径
数据保留期的设置路径为:GA账户→管理→媒体资源设置→数据收集与修改→数据保留→选择最长保留期限

【有新的用户活动时重置】表示:当同一用户再次访问网站或应用时,其数据保留周期会被重新计算。但这并不能替代长期数据留存方案,因为整体数据仍然受最大保留期限限制。
数据导出到 BigQuery:免费版GA也能构建长期数据资产
由于 GA4 的数据保留机制不可回溯,如果您暂时不需要升级 GA360,那么最稳妥的做法就是在初始化阶段就将 GA4 与 BigQuery 进行连接,用数据仓库来建立长期数据留存机制。
GA4 解决的是“数据采集与基础分析”的问题,而 BigQuery 解决的是“数据长期保存与深度利用”的问题。
在 UA 时代,将数据导出到 BigQuery 仅限 GA360 用户。但在 GA4 中,这一功能已经对标准版(免费版)开放。这意味着即使在业务早期阶段、数据量尚未达到企业级规模,也可以以较低成本构建自己的数据资产体系。
很多企业在这一阶段会有一个典型判断:“现在数据量还不大,暂时没必要接入 BigQuery。”但从数据资产的角度来看,这种判断往往会带来长期成本。
首先,BigQuery 并不会补传历史数据,是否接入决定的是“从什么时候开始积累数据”。如果等到数据规模变大、分析需求提升之后再接入,早期这段用户行为数据将缺失,而这部分数据也正是分析用户长期价值的重要基础。
其次在数据量较小时接入 BigQuery,成本通常是可控甚至非常低的,但可以提前建立完整的数据结构与使用习惯。一旦业务增长这些数据将自然积累,避免后期重新搭建带来的复杂度与断层问题。
BigQuery 的价值不取决于“当前数据有多少”,而取决于“是否开始积累数据”。
需要注意的是,BigQuery 只会从成功导出的那一刻开始接收数据,越早完成 GA4 到 BigQuery 的连接,企业能够沉淀的数据资产就越完整,也越能避免后续分析中的数据断层问题。
在实际项目中,我们看到大多数企业并不是不重视数据,而是在早期阶段低估了数据留存的重要性,等到真正需要长期分析能力时,才意识到已经错过了最佳时机。
什么是 BigQuery?
简单来说,Google BigQuery 是 Google Cloud 提供的全托管、无服务器数据仓库服务,可以用于存储和分析海量数据。
不同工具承担不同角色,BigQuery 位于中间层,是整个数据体系的核心基础设施。
-
GA4:负责数据采集与基础分析
-
BigQuery:负责数据存储与计算(数据底座)
-
BI 工具(如 Looker Studio):负责数据可视化
如果没有这一层,企业的数据能力就会停留在“报表层”;而有了这一层,数据才真正成为可以积累、复用和扩展的数据资产。
BigQuery 的核心能力
1. 规模无上限,成本可控制
BigQuery 采用计算与存储分离架构,无论是 GB、TB 还是 PB 级数据,都可以持续存储并高效计算,复杂查询通常在秒级完成,不会因数据规模增长而产生性能瓶颈。
同时,存储与计算分开计费:存储按数据量收费,查询按扫描数据量收费。这意味着企业可以长期保存大量原始数据,并根据实际使用情况控制计算成本。
这种架构非常适合长期保存用户行为数据和多源业务数据,而无需提前规划容量或担心系统性能问题。
2. 与 AI 深度集成
在当前 Google Cloud 架构中,BigQuery 不只是数据仓库,也是 AI 的数据底座。
它可以直接对接 Google Cloud Vertex AI 进行模型训练,同时内置 BigQuery ML,支持在 SQL 层面直接构建模型。这意味着企业可以在同一平台完成数据存储、分析以及模型训练与应用。
3、多源数据整合
BigQuery 可以整合来自不同系统的数据,包括:
-
GA4 行为数据
-
CRM 客户数据
-
销售与订单数据
-
非谷歌广告投放数据
这些数据可以汇聚到同一平台,实现跨渠道、跨系统的统一分析,而不再依赖单一工具的局部视角。
如何在GA中设置 BigQuery 导出
第 1 步:创建 Google API 控制台项目并启用 BigQuery
-
登录 Google Cloud 控制台(https://console.cloud.google.com/)
-
创建或选择一个现有项目
-
打开“API 和服务” → “库(Library)”

-
搜索并启用 BigQuery API
-
按提示完成配置
您需要拥有编辑者权限或更高权限才能创建 Google API 控制台项目并启用 BigQuery。
在实际操作中,一些企业可能会遇到以下问题:
-
无法创建项目
-
组织策略限制导致 API 无法启用
-
计费或账号配置不完整
如果在创建或配置过程中遇到问题,也可以联系触脉咨询获取支持,我们可以协助完成 Google Cloud 项目搭建及 BigQuery 初始化配置。
第 2 步:在 GA4 中关联 BigQuery
-
进入 GA4 → 管理 → 产品关联 → BigQuery。在操作前,请确认您已经是需要媒体资源的编辑或更高权限以及Bigquery项目的所有者(owner)权限。

-
点击选择一个 BigQuery 项目(这里会列出您有权限的BQ项目),然后点击确认。

-
选择数据存储区域

-
依次根据您的实际情况和业务需求进行后续配置,检查完成后点击提交。
第 3 步:验证服务账号
在 Google Analytics 与 BigQuery 关联的过程中,系统会创建服务账号 firebase-measurement@system.gserviceaccount.com,您需要确认已将该账号添加为项目成员并开通了 BigQuery User (roles/bigquery.user) 角色。这是最常见的配置问题之一,如果服务账号没有权限将导致GA4导出失败。
相比之下,提前完成 GA4 与 BigQuery 的连接,成本并不高,却可以避免后续绝大多数数据缺失与分析受限的问题。
如果您正在评估是否需要接入 BigQuery,或在配置过程中遇到权限、架构或成本方面的问题,可以联系触脉咨询。我们可以结合您的业务阶段,帮助您设计更合适的数据方案,并协助完成 GA4 与 BigQuery 的落地配置。
TRUEMETRICS(触脉咨询)成立于2012年。目前是 Google Marketing Platform(GMP)官⽅认证合作伙伴以及Google Cloud Platform(GCP) Resell 和 Service 认证合作伙伴。是更全面的OneGoogle生态(GMP+GCP两大核心平台)数据咨询服务及解决方案提供商。
专注为出海品牌提供数据⼯具实施、数据培训、数据可视化、数据分析、数据集成咨询等综合解决方案;致力于为零售、⾼科技、消费品、游戏、航旅等行业出海提供数据护航。在北京、上海、深圳、香港设立有分支机构。



