营销人员的Data Locker使用指南

高阶付费

推荐用于

营销人员 营销人员 开发商

最近更新： 2025年09月01日 05:27

概要：Data Locker可以将您的报告发送到云端，或入库到您的BI系统。我们支持多种云端存储方式，您可以选择AppsFlyer的AWS数据存储桶，也可以使用您在 AWS、GCS、Yandex、BigQuery和Snowflake上的自有存储桶。Data Locker还支持多宿端数据传输，也就是说，您可以将所有数据传输到多个宿端、分宿端传输不同数据，或结合这两种方式传输数据，

速览

您可以在Data Locker中选择您需要AppsFlyer传输到指定宿端的数据，可用的维度包括应用、媒体渠道、事件和报告。然后您就能通过程序化的方式将这些数据从云端入库到您的系统中。

Data Locker——功能简介

功能	说明
存储方式	Data Locker可以将您的数据发送到下列任一云平台： AppsFlyer的AWS数据存储桶您在以下平台的自有数据存储桶： AWS GCS 【Beta】Azure Blob 【Beta】Yandex BigQuery Snowflake 您可以在Data Locker中设置多个宿端。也就是说，您可以将部分或所有数据发送到多个宿端。示例按报告类型隔离数据：将原始数据发送到GCS，将汇总数据发送到Snowflake。按应用隔离数据：将各应用组的数据分别发送到不同的数据存储桶。
多应用程序	Data Locker可以发送您AF账户下的某个、某些或所有应用的数据。您在账户中添加应用时，Data Locker可自动涵盖这些新应用的数据。
可用窗口期	14天
数据隔离	云端数据存储桶的数据隔离选项包括：【默认】归并：即合并所有应用的数据。您可以使用每一行中的应用ID字段在数据文档中区分具体应用。按应用隔离数据：Data Locker可以将每个应用的数据分别放在单独的文件夹里，文件夹名称中包含具体的应用ID。
数据格式选项	适用于云端数据存储桶： CSV PARQUET Adobe 数据仓库
数据时效性	不同报告类型的数据时效性不同：每小时：滚动生成数据；AppsFlyer接收到激活和应用事件数据后数小时内就会将其写入存储桶。每日：卸载等报告每天更新一次，您可在次日拉取前一天生成的报告。文档编号：如果在同一指定时段内多次生成同一种报告，Data Locker会对文档进行编号。

可通过Data Locker拉取的报告

Data Locker报告设置

如需配置Data Locker，请按照以下步骤完成云服务对接、导出设置以及报告内容的自定义：

1. 设置云服务

您可以将Data Locker与一个或多个云服务提供商连接。请参考以下说明，了解如何将云服务与Data Locker对接：

AWS存储桶
GCS存储桶
【Beta】Azure Blob
【Beta】Yandex存储桶
BigQuery数据仓库
Snowflake数据仓库

请注意：如果您的套餐中不含Data Locker，但含群组分析报告或SKAN数据，您也必须完成上述自有云端存储工具设置。

2. 添加云服务连接

在完成云服务账号与Data Locker的对接配置后（参见上文设置云服务），您需要在Data Locker中使用账号凭证创建一个连接。每个账号最多可以创建2个连接。

注意

默认情况下，每个账号最多可以开启2个Data Locker连接。如需创建其他连接，请联系您的客户成功经理（CSM）。

创建云服务连接步骤如下：

在AppsFlyer后台左侧的菜单栏中选择导出 > Data Locker。
在右侧点击新建连接。
在连接名称 中输入您的连接名称。仅限小写字母、数字和连字符（-）。
单击您需要连接的云服务图标。
根据所选服务，输入对应的连接信息。
AWS云存储桶连接
在设置AWS连接之前，请先创建一个AWS存储桶。如需了解创建方法，请参见此处。

设置步骤如下：
1. 输入您的Amazon S3存储桶名称，必须手动在其中添加前缀af-。
2. 点击测试连接。
3. 确保未收到“存储桶路径无效”的报错消息。
4. 选择该连接是否需要支持Adobe Experience Platform。如选择启用，请点击保存并继续设置全局过滤器。
5. 点击Save保存。
GCS云存储桶连接
在设置GCS连接之前，请先创建一个存储桶。如需了解创建方法，请参见此处。

设置步骤如下：
1. 输入您的GCS存储桶名称。
2. 点击测试连接。
3. 确保未收到“存储桶路径无效”的报错消息。
4. 选择该连接是否需要支持Adobe Experience Platform。如选择启用，请点击保存并继续设置全局过滤器。
5. 点击Save保存。
Azure云存储桶连接
在设置Azure连接之前，请先创建一个Azure存储账号。如需了解创建方法，请参见此处。

设置步骤如下：
1. 输入您的连接名称、存储账户名称以及密钥。
2. 确保未收到“存储桶路径无效”的报错消息。
3. 选择该连接是否需要支持Adobe Experience Platform。如选择启用，请点击保存并继续设置全局过滤器。
4. 点击Save保存。
Yandex云存储桶连接
在设置Yandex连接之前，请先创建Yandex服务账号。如需了解创建方法，请参见此处。

设置步骤如下：
1. 输入您的存储桶名称、访问密钥（Access Key）和私人密钥（Secret key）。
2. 确保未收到“存储桶路径无效”的报错消息。
3. 选择该连接是否需要支持Adobe Experience Platform。如选择启用，请点击保存并继续设置全局过滤器。
4. 点击Save保存。
BigQuery 数据仓库连接
在设置Yandex连接之前，请先创建Yandex数据集。如需了解创建方法，请参见此处。

设置步骤如下：
1. 输入您的BigQuery项目ID和数据集名称。
2. 点击测试连接。
3. 确保未收到“存储桶路径无效”的报错消息。
4. 点击保存并继续设置全局过滤器。
Snowflake数据仓库连接
在设置Snowflake连接之前，请先创建Snowflake账户。如需了解创建方法，请参见此处。

设置步骤如下：
1. 输入您的Snowflake地区和账户ID。
2. 点击测试连接。
3. 确保未收到“存储桶路径无效”的报错消息。
4. 点击保存并继续设置全局过滤器。
点击保存。系统将显示报告输出设置部分。

注意

您可以通过审计日志确认连接是否已创建、更新或删除，并查看操作的执行者。

3. 设置报告输出参数

在完成与云服务的连接后，接下来可对Data Locker报告输出的通用参数进行设置。如果您使用的云服务是BigQuery或Snowflake，则可跳过此步骤。

在报告输出设置部分下，选择文件夹结构 (数据分流方式)：
- 统一 (默认）：报告文件包含所有应用的数据记录。
- 按应用取数：每份报告文件只包含一个应用的数据。
选择报告文件格式：Parquet（默认）或CSV。
选择报告的文件压缩类型：
- Snappy（仅限Parquet文件）
- GZIP
选择单个文件中的最大行数：可选值为10k，25k，50，100k，200k，或500k。行数越多，生成的文件数量越少，单个文件越大。

注意

在预期路径 下，查看报告的路径模式。请注意：实际路径可能与显示不同。

4. 选择全局筛选条件

全局筛选条件可帮助您按应用或媒体渠道筛选报告。这些筛选条件适用于您数据存储账户中的大多数报告，您也对报告进行单独设置（请参见后文中的7-选择报告层级筛选条件）。如果在全局和报告层级同时设置筛选条件，则报告层级的筛选条件优先。

设置筛选条件的操作如下：

在报告部分，点击所需的筛选条件并选择报告中需包含的项目。例如，点击应用筛选条件并选择报告中需包含的应用。
点击回车（⏎）按钮。

5. 选择报告组

选择您希望在云服务中获取的报告。报告以组的形式列出，点击组名可以展开或收起。

选择一份报告，点击展开报告组。展开报告组后，报告会显示以下信息：
- 报告名称：报告的名称。
- 数据集名称：包含该报告数据的数据库名称。
- 数据时效性：数据更新频率（例如：按小时、按天或按版本）。
- 字段：已选择的字段数量/可供选择的字段总数。

6. 自定义或复制报告

选定一个或多个报告后，您可以选择自定义原始报告或复制并自定义报告副本。该功能可帮助您在不影响原始版本的情况下，为不同的业务场景创建定制化报告。

方案A：自定义原始报告

点击报告名称旁边的 自定义按钮。
打开报告编辑器，选择需要的字段并应用筛选条件。
修改将直接保存到原始报告配置中。

请注意：该操作将改变报告传送到云存储的方式。

方案B：复制报告

点击报告名称的。
在下拉菜单中选择复制。
系统会生成一个新副本，名称前缀为copy_of_。
复制后的报告将以编辑模式打开，方便您进行自定义设置。

提示：复制功能适用于为不同场景创建多种版本的报告。

完成自定义设置或复制报告后，您可进入下一步，配置报告字段。

7. 选择报告字段

完成自定义设置或复制报告后，您需要定义报告中应包含哪些字段。所有报告均包含完整的字段集合，您可以根据分析或对接需求进行筛选。默认情况下，所有字段均已选中。您也可以手动勾选需要的字段，或取消不需要的字段。

操作步骤：

在所选报告的编辑窗口中，在字段将鼠标悬停在字段上，可查看字段说明。
勾选要包含的字段，取消勾选要排除的字段。
点击应用保存设置。

从其他报告复制字段配置

您可以先从其他报告中复制字段为基础，然后继续勾选或取消勾选字段以微调报告。

在字段选项卡中，先随意取消勾选一个字段。
点击Pull schema from report。
选择您希望复制字段配置的报告。
根据需要继续勾选或取消字段。
如需恢复报告的原始字段配置，点击刷新。

8. 选择报告级筛选条件

您可以借助报告级筛选条件对某一份报告按应用、媒体渠道等维度进行筛选。您也可以设置全局筛选条件，应用于账号中的所有报告；参见选择全局筛选条件。默认情况下，报告级筛选条件是根据全局筛选条件设置的，您也可以仅针对该报告进行自定义设置。

为指定报告设置筛选条件的步骤如下：

将鼠标悬停在要自定义的报告上。
点击打开操作菜单，然后选择 编辑报告。
打开筛选条件选项卡。此时筛选条件默认为全局筛选条件。
点击筛选条件并选择报告中需包含的项目。例如，点击应用筛选条件并选择报告中需包含的应用。
点击回车（⏎）按钮。您的选择将应用于全局设置。
（可选）对于应用内报告，您可以设置应用内事件筛选条件。请输入事件的准确名称。
点击应用保存设置。

9. 移除历史字段

历史字段指之前包含在报告结构中，但现在已不包含的字段。建议您移除这些字段，确保报告只包含相关信息。在移除前，请确认该操作不会对您的工作流或对接流程产生影响。

移除历史字段的操作如下

打开历史字段选项卡。
启用：在报告中包含旧版字段（Include legacy fields in the report）。
取消勾选要排除的字段。
点击应用。
保存连接设置。

移除所有历史字段：

打开历史字段选项卡。
关闭：在报告中包含旧版字段（Include legacy fields in the report）。

注意

如果您希望在报告中包含旧版字段，但字段列表呈灰色且被锁定，请联系您的客户成功经理（CSM）。

非空值历史字段

大多数旧版字段为空或nullnull。但少部分字段仍包含数据，之所以被归类为历史字段，是因为：

它们在报告中已被重命名。
它们被排除在报告架构之外（已弃用）。

下载非空值历史字段列表（CSV）。

10. 保存连接

点击保存，首次数据转储将在3小时内写入您的云服务。此后，数据更新频率视具体报告而定。

重要提示！

对Data Locker设置的任何更改最多3小时后才能生效。

设置用户权限

具有必要权限的管理员和团队成员都可以访问Data Locker。

管理员

管理员可以访问Data Locker页面、创建并管理所有的连接、开放编辑权限、指定现有连接的所有者。

团队成员

团队成员可以访问Data Locker页面、编辑现有连接（需具备所有者权限）、创建新连接。

开放权限

如需向某个团队成员开放Data Locker的权限，请为其分配一个带有Data Locker管理权限的角色。
如需迁移某个现有连接的所有者权限，或向团队成员开放其编辑权限，请点击该连接中的选项菜单图标，然后点击管理所有者权限，即可进行所需操作。

数据存储结构

概览

您的数据构架取决于您使用的数据存储工具，即云存储或数据仓库。下文所述的目录结构是数据存储桶中的结构。如果您使用数据仓库存储数据，则其中的视图结构与本文中的目录结构类似，

Data Locker会将数据写入您指定的存储工具中。如果您使用云存储，您可以选择AppsFlyer的AWS存储桶或者您在AWS、GCS或Yandex上的自有存储桶。您可以随时切换存储工具、数据切分方式和数据宿端。

Data Locker以分级的目录结构将数据写入存储桶中，分级维度为报告类型、日期和时间。下图为目录结构示例：下图为目录结构示例：

具体报告的数据保存在该报告类型下的小时数（h）文件夹中：

报告的数据时效性（每小时更新、每天更新或版本化）决定了文件夹名称中的小时数。
通过Snappy或GZIP压缩文件或未压缩的Parquet或CSV文件提供数据。
数据文件由列（字段）组成。
各种用户链路报告都具有完全相同的schema（字段）结构，具体取决于您选择的字段。其他报告各自有其显式字段，即无结构（schemaless）报告。详情请见营销人员的Data Locker报告，其中列出了可用的报告并提供了各种报告的说明文档链接。

目录结构

分应用取数

如果您使用云端存储桶，Data Locker可以将所有指定应用的数据文件合并到统一的数据文件中，也可以将数据按应用分别写入不同的文件夹中。分应用写入的数据会放在h文件夹下，详情请见下表。

数据文件

不同的分类取数方式会产生不同的数据文件。

内容	说明
完成标签	一个h文件夹中的所有数据都写入完毕后，系统会设置末尾文件（完成）标签。请务必先确认数据带有_SUCCESS标签，然后再拉取数据。即使某个文件夹中没有数据可写（即该文件夹为空时），系统也会设置_SUCCESS标签。请注意：在分应用取数时，需在h文件夹（而非应用文件夹）中确认该标签。详情请见上节图示。
文件类型	通过Snappy或GZIP压缩文件或未压缩的Parquet或CSV文件提供数据。解压后的数据文件是Parquet或CSV格式的，具体取决于您的设置。
字段顺序（CSV文件）	如果是CSV文件，则报告中的字段顺序总是不变的，新添加的字段会出现在现有字段的右侧。在这种情况下：各种用户链路报告的字段结构完全一致。也就是说，不同类型的报告可以使用相同的数据入库流程。请参考原始数据字段词典中的字段释义，在报告中选择您需要的字段。在报告可用性部分中，带有FF标记的报告字段结构与一般报告不同。
字段填充注意事项	空白或空字段：字段可能为空或为null，出现这种情况即表示这个字段在该报告中没有数据可以上报。一般来说，null表示该字段在相应报告和应用类型中不适用。空值（显示为"'）表示该字段适用于相应的报告和应用类型，但未找到相关数据。如果媒体渠道受限，则受限字段的值为“null”。总体而言，null值和空值的含义基本相同，都可以理解为没有可用的值。时区和货币您在应用配置中指定的时区和货币对Data Locker中的数据无效。Data Locker数据的时区和货币单位如下：时区日期和小时数按UTC时间计算。货币：event_revenue_usd字段以美元为单位。带逗号的值：逗号包含在双引号`"`中，例如，`"iPhone6,1"`。

存储工具选项

注意：

如果您使用的是广告主侧自有存储工具：

请确保您符合GDPR等数据隐私条例以及广告平台/SRN的数据保存规定。
请勿使用您的自有存储桶向第三方发送数据。

可选的存储工具如下：
- AppsFlyer存储桶
- 客户自有存储工具——AWS、GCS、Azure、Yandex、BigQuery和Snowflake
您可以随时切换存储工具。
更改存储工具后会发生以下变化：
- AF会在一小时内将数据写入新的存储桶。
- 更改存储工具后会有一个7天的过渡期，在此期间我们会继续将数据写入原先的存储工具。您可以在AF后台查看过渡期的结束时间，以便对后续的数据入库流程变更做出相应的安排。您也可以根据实际情况重启过渡期，或换回AppsFlyer存储桶。
- 切换存储选项：您可以使用多宿端存储选项，将数据同时发送到多个宿端，这样就能切换存储选项。完成迁移和测试后，请删除弃用的存储选项。

	AppsFlyer的AWS存储桶	广告主自有存储工具（AWS、GCS、Azure、Yandex、BigQuery和Snowflake）
存储区名称	由AppsFlyer设置	GCS：没有限制 AWS：由广告主设置。必须带有前缀af-。示例：`af-datalocker-your-bucket-name`
存储桶所有者	AppsFlyer	营销人员
存储平台	AWS	AWS、GCS、Azure、Yandex、BigQuery、Snowflake
广告主用于访问数据的证书	AppsFlyer账户的管理员可以在其Data Locker界面中查看此信息。	AppsFlyer不掌握该信息。用户证书是由云服务商提供的。
数据保留	数据会在14天后自动删除。	广告主侧负责
数据删除请求	由AppsFlyer执行	广告主侧负责
数据安全	存储桶由AppsFlyer管理。客户具有只读权限。	存储工具的控制权限在广告主侧。 AWS：AppsFlyer需要存储桶的GetObject、ListBucket、DeleteObject、PutObject权限。该存储桶必须仅用于AppsFlyer数据存储。请勿将其用于其他用途。 GCS：详情请见GCS配置指南。
存储容量	由AppsFlyer管理	由广告主侧管理
使用带存储桶策略的VPC端点读取数据	不适用	【可选】如果您在AWS的存储桶层级采取了VPC端点安全防护措施，必须将AppsFlyer的服务器加白。

广告主自有存储桶的数据安全负责人须知

考虑：

该存储桶或宿端仅可用于AppsFlyer的数据写入，不能有其他实体向该宿端写入数据。
AF写入数据的25小时后您可以从相关宿端中删除该数据。
宿端中的数据是AF服务器中数据的副本。我们会按AF的数据保存规定将这些数据保存在服务器中。
出于技术原因，我们有时需要删除并重写数据。Data Locker需要具备delete（删除）和list（列出）权限。这两项权限不会带来安全风险。对于list权限，，我们是唯一可以向存储桶写入数据的实体。在delete权限下，我们能够在需要时重新生成数据。
如需了解其他相关信息，请发送邮件至hello@appsflyer.com联系我们的数据安全团队或您的CSM。

多宿端作用原理

您可以使用Data Locker将您的部分或所有数据发送到2个宿端（在连接部分设置）。比如，将A应用的数据发送到AWS，将B应用的数据发送到GCS。

每个连接由一套完整的Data Locker设置组成，其中包含一个宿端。每个连接的设置都是单独分开的。

管理宿端连接时需注意以下几点：

宿端连接在Data Locker设置部分中，分单独的标签页显示。也就是说，您可以在各连接的专属标签页中管理其配置。每个标签页的图标代表相应的存储工具类型。
如需查看连接详情、创建连接副本或删除连接，请点击⋮（选项图标）。

其他相关信息

在审计日志中跟踪连接变更

您可以在AppsFlyer面板的安全中心查看Data Locker连接的变更记录。通过审计日志，您可以确认是否发生了变更、变更时间以及执行操作的用户。您可以在不依赖支持团队的情况下，排查缺失数据或连接意外变更等问题。

审计日志会记录以下生命周期事件：

创建新连接
更新连接
禁用连接
删除连接

访问审计日志的步骤如下：

在顶部导航栏中，打开账户菜单。
选择安全中心。
在审计日志部分，点击查看审计日志。
在筛选条件中选择“服务”：Data Locker以查看相关条目。

详情请见审计日志。

特性与局限性

特点	说明
广告平台	广告平台不可用
代理	代理不可用
应用层级的指定时区	不适用。Data locker文件夹按UTC时间逐时拆分。实际事件时间是以UTC时间显示的，请根据需要将其换算到其他时区。不论您在应用配置中设定了哪个时区，从事件发生到Data Locker记录事件之间的延迟保持不变。
应用配置中的指定货币	不支持
大小限制	不适用
数据时效性	数据的更新频率取决于具体报告的数据时效性，详情请见本文档。
历史数据	不支持。如需拉取历史数据，请使用Pull API（仅部分报告具有可用的历史数据）。
受限数据	为了符合隐私政策的规定，部分报告中的字段受限。详情请见此处说明。
用户权限	如需配置Data Locker，须具备相关权限。
单应用/多应用	支持多应用取数。Data Locker是帐户级别的功能。
最大连接数	默认情况下，每个账号最多可以开启2个Data Locker连接。如需申请额外连接，请联系您的客户成功经理（CSM）。

问题排查

问题：无法使用AWS CLI获取数据
报错消息调用ListObjectsV2时出现错误（AccessDenied），收到“Access Denied”消息（拒绝访问）访问被拒绝
原因：AppsFlyer存储桶的AWS证书不正确。这可能是由于您的计算机上有多个证书或无效证书。
解决方法：
1. 请换一种方法（例如Cyberduck）访问存储桶，不要使用CLI。这是为了验证您使用的证书是否能正常生效。如果可以通过Cyberduck连接，则表明是证书缓存的问题。
2. 刷新AWS证书缓存。
  Screenshot from AWS

AWS数据拉取

本节解释了AWS数据拉取工具的使用方式，这些工具包括AWS CLI、Cyberduck、Amazon S3浏览器。请注意：下文说明是针对AppsFlyer存储桶编写的。如果您使用的自有存储桶，请根据实际情况调整相关操作。

AWS CLI

前期准备 ：

在您的电脑上安装AWS CLI。
从AppsFlyer面板进入Data Locker配置页面，然后在证书栏中获取所需信息。

请按以下方式使用AWS CLI：

在Windows中使用<Windows>+<R>键，然后点击OK，打开相关终端。
界面显示命令行窗口。
输入aws configure。
输入证书面板中显示的AWS Access Key。
输入证书面板中显示的AWS Secret Key。
输入eu-west-1。
按下回车键。

根据需要使用以下CLI命令。

您可以在以下命令中找到{home-folder} 的值

如需在存储桶中列出文件夹：

aws s3 ls s3://af-ext-reports/{home-folder}/data-locker-hourly/

列出文件和文件夹

Data Locker存储桶中有三类文件夹：

报告类型t=
日期（date）dt=
小时h=

如需列出某个报告类型下的所有报告：

aws s3 ls s3://af-ext-reports/{home-folder}/data-locker-hourly/t=installs/

如需列出某个报告类型在某个日期的所有报告：

aws s3 ls s3://af-ext-reports/{home-folder}/data-locker-hourly/t=installs/dt=2019-01-17

如需列出某报告类型在某日某时的所有报告：

aws s3 ls s3://af-ext-reports/{home-folder}/data-locker-hourly/t=installs/dt=2019-01-17/h=23

如需下载特定日期的文件：


aws s3 cp s3://af-ext-reports/<home-folder>/data-locker-hourly/t=installs/dt=2020-08-01/h=9/part-00000.gz ~/Downloads/

Cyberduck

前期准备 ：

安装Cyberduck客户端。
从AppsFlyer面板进入Data Locker配置页面，然后在证书栏中获取所需信息。

请按以下步骤配置Cyberduck：

在Cyberduck后台点击“Action”（操作）。
选择New Bookmark（新建书签），打开配置窗口。
在第一个字段（在下面的截图中标记为 [1]）中选择 Amazon S3。
填写以下字段：
- 昵称：自定义文本
- Server（服务器）：s3.amazonaws.com
- Access Key ID（访问密钥ID）：复制AppsFlyer后台的证书栏中显示的AWS Access Key。
- Secret access key（秘密访问密钥）：复制AppsFlyer后台的证书栏中显示的Bucket Secret Key。
- 路径：{存储桶名称}/{主文件夹} 例如：af-ext-reports/1234-abc-ffffffff
点击窗口右上角的X，关闭该窗口。
选择相关连接。
界面会展示数据目录。

Amazon S3浏览器

前期准备 ：

安装Amazon S3浏览器。
从AppsFlyer面板进入Data Locker配置页面，然后在证书栏中获取所需信息。

请按以下步骤配置Amazon S3浏览器：

在S3浏览器中点击Accounts > Add New Account。
界面打开Add New Account（添加新账户）窗口。
填写以下字段：
- Account Name（账户名）：自定义文本。
- Access Key ID（访问密钥ID）：复制证书栏中的AWS Access Key。
- Secret Access Key（秘密访问密钥）：复制证书栏中的Bucket Secret Key。
- 选择Encrypt Access Keys（对密钥加密），输入密码。将此密码记录下来，以防遗忘。
- 选择Use secure transfer（使用安全传输）。
点击Save changes。
点击Buckets > Add External Bucket（添加外部存储桶）。
界面打开Add External Bucket窗口。
输入Bucket name（存储桶名称）。桶名称的格式如下：{桶名称}/{主文件夹}。您可以在在证书窗口中看到存储桶名称和主文件夹的值。
点击Add External bucket（添加外部存储桶）。系统创建存储桶并将其展示在窗口左侧边栏中。
完成上述操作后，您就能访问Data Locker文件了。

文件夹	说明
订阅ID（Subscription ID）	存储桶中的根目录命名方式取决于广告主和云服务商。一般情况下，根目录的名称即您的Subscription ID，但如果您使用Cyberduck，则该ID通过书签设置，而不会显示在目录结构中。 data-locker-hourly目录下是报告主题文件夹，其上级目录取决于存储桶的所有者和相关的云服务商。各种场景的文件夹结构示例： AppsFlyer存储桶：<af-ext-reports>/<unique_identifier>/<data-locker-hourly> 您的AWS存储桶：<af-datalocker-your bucket prefix>/<generated-home-folder><subscription-id> 您的GCS存储桶：<your bucket name>/<generated-home-folder>/<subscription-id>
主题（t）	报告类型与报告主题相关。
日期（dt）	代表相关的数据日期。对于原始数据，该日期表示事件发生的日期。对于汇总数据，该日期表示上报日期。
时间（h或版本编号）	日期文件夹以小时数（h）或版本编号命名，具体取决于报告类型。以小时数命名的文件夹 h文件夹的小时数是指AppsFlyer接收到数据的时间。比如AF会将UTC时间14:00-15:00之间接收到的激活数据写入h=14文件夹中。请注意：AF接收数据后需要1-3小时左右才能将相应的h文件夹写入Data Locker中。比如h=14文件夹会在1小时后，即UTC时间15:00写入到Data Locker中。小时数文件夹的特点：共有24个h文件夹，分别以0-23编号，比如h=0、h=1等等。 h=late（延迟）文件夹用于存储次日凌晨之后接收到的前一天的事件，即UTC时间的次日00:00–02:00之间发送到AF的事件。举例来说，如果某用户在UTC时间周一08:00激活某个应用，AF在UTC时间周二01:00接收到该激活，则AF会将该激活写入周一的延迟文件夹中。 AF会将UTC时间02:00之后接收到的数据按实际的接收日期和小时数写入相应的文件夹中。取数时请务必一并拉取h=late文件夹中的数据，任何其他文件夹都不包含这些数据。 _temporary 文件夹：在某些情况下，系统会在h文件夹内生成一个临时文件夹。请忽略这些临时文件夹及其子文件夹。例如：/t=impressions/dt=2021-04-11/h=18/_temporary。请注意：原始数据报告每天写入一次，保存在h=23文件夹中。卸载报告一般保存在h=2文件夹中，但也可能出现在其他文件夹中。群组和增量报告直接保存在dt文件夹中。版本化报告的命名与本节所述方式不同。非UTC时区应用的逐时报告注意事项要确保拉取到某一天的全部数据，必须按应用时区来确定具体日期，并拉取该日期的文件夹。方法如下：东半球时区：如需拉取某个日期的所有数据，必须按UTC时间和日期取相应文件夹中的数据。举例来说，假设相关应用的时区是UTC+10（澳大利亚悉尼）。要获取悉尼时间周二的所有小时数据，您需要读取以下文件夹：周一：h=14–23 以及晚些时候的文件夹周二：h=0–13 和 h=14–15 为什么需要读取周二的 h=14–15 文件夹？这是因为有些数据传输到AF可能会有延迟，h=14–15 文件夹中可能包含这些延迟事件。然后，您还需要将悉尼日期换算成UTC日期，按相应的event_time（事件时间）筛选数据。西半球时区如需拉取某个日期的所有数据，必须按UTC时间和日期取相应文件夹中的数据。举例来说，示例：假设相关应用的时区是UTC- 7（美国洛杉矶）。要获取洛杉矶时间周二的所有小时数据，您需要读取以下文件夹：周二：h=7–23 以及晚些时候的文件夹周三：h=0–6 和 h=7–8注意：取数时必须包含周三的h=7-8文件夹，这是因为有些数据传输到AF可能会有延迟，而这些延迟送达的事件数据会出现在h=7–8文件夹中。然后，您还需要将悉尼日期换算成UTC日期，按相应的event_time（事件时间）筛选数据。部分报告可按版本化方式命名部分报告会按版本化方式命名。也就是说，Data Locker会多次写入指定日期的最新数据。这是因为有些数据的接收会有延迟，或后续出现了更准确的数据，因此Data Locker中的数据会持续更新，从而使同一个报告出现多个版本，其中最近期的版本数据最准确。指定日期的报告保存在该日期下的版本编号文件夹中。每个版本各自放在单独的文件夹中，这些文件夹的名称是通过Epoch时间戳来命名的，用以识别相关报告。在设计数据入库流程时，请务必注意Data Locker会回溯性地写入数据。比如Data Locker可能会在1月14日在1月1日的文件夹中写入数据。如果您使用的是自有存储桶，建议使用云服务消息通知来触发入库流程（AWS \| GCS）

速览

Data Locker——功能简介

可通过Data Locker拉取的报告

Data Locker报告设置

1. 设置云服务

2. 添加云服务连接

注意

AWS云存储桶连接

GCS云存储桶连接

Azure云存储桶连接

Yandex云存储桶连接

BigQuery 数据仓库连接

Snowflake数据仓库连接

注意

3. 设置报告输出参数

注意

4. 选择全局筛选条件

5. 选择报告组

6. 自定义或复制报告

7. 选择报告字段

8. 选择报告级筛选条件

9. 移除历史字段

注意

非空值历史字段

10. 保存连接

重要提示！

设置用户权限

数据存储结构

概览

目录结构

以小时数命名的文件夹

部分报告可按版本化方式命名

分应用取数

数据文件

存储工具选项

注意：

广告主自有存储桶的数据安全负责人须知

多宿端作用原理

其他相关信息

在审计日志中跟踪连接变更

特性与局限性

问题排查

AWS数据拉取

AWS CLI

列出文件和文件夹

Cyberduck

Amazon S3浏览器

相关文档