Data Clean Room - 클라우드 스토리지 및 데이터 파일 설정

프리미엄

요약: 앱스플라이어 Data Clean Room에서 사용할 클라우드 서비스 버킷, 폴더 경로 및 파일을 설정합니다. 버킷은 AWS S3, GCS 또는 둘 다에 있을 수 있습니다.

개요

앱스플라이어 Data Clean Room(DCR)을 통해 광고주는 자사 사용자 수준 데이터를 앱스플라이어 사용자 수준 어트리뷰션 데이터와 일치시키고 보강함으로써 자사 사용자 수준 데이터의 가치를 활용할 수 있습니다. 결과적으로 집약형 리포트는 사용자의 개인 정보를 보존하는 동시에 광고주에게 이 결합된 데이터만 제공할 수 있는 귀중한 통찰력을 제공합니다.

DCR 사용 준비에는 클라우드 서비스 저장소를 설정하고 업로드할 데이터 파일의 형식이 올바르게 지정되어 DCR로 전송되었는지 확인하는 작업이 포함됩니다.

클라우드 서비스 스토리지

클라우드 서비스 스토리지는 앱스플라이어 DCR(Data Clean Room)에서 다음의 2가지 주요 목적으로 사용됩니다.

  • 입력: 앱스플라이어가 BI 시스템에서 생성한 자사 데이터 파일을 읽는 위치
  • 출력: DCR 처리 후 앱스플라이어가 리포트를 전달하는 목적지

이러한 목적에 하나 이상의 버킷을 사용할 수 있습니다(AWS, GCS 또는 둘 다에서). 그러나 대부분의 경우 가장 관리하기 쉬운 구조에는 다음이 포함됩니다.

  • 단일 클라우드 서비스의 단일 버킷
  • 버킷 바로 아래에 있는 DCR 키로 식별되는 폴더
  • 최상위 폴더 아래에 2개의 개별 폴더 경로: 하나는 입력용, 하나는 출력용

본 기사에서는 이 구조를 만들기 위한 지침을 제공합니다.

DCR 이름 지정 요구 사항

다음 이름 지정 요구 사항은 모든 DCR 데이터 엔터티(버킷, 폴더 및 파일)에 적용됩니다.

  • 최대 길이: 200자
  • 유효한 문자:
    • 문자 (A-Z, a-z)
    • 숫자 (0-9), 이름의 첫 문자가 될 수 없습니다.
    • 하이픈 (-) 이름의 첫 번째 문자가 될 수 없습니다.
  • 유효하지 않은 문자:
    • 공백
    • 기타 모든 기호 또는 특수 문자
  • 특별한 목적으로만 사용되는 문자:

 참고

AWS 및 GCS는 각 폴더 이름 끝에 슬래시(/)를 자동으로 추가합니다. 버킷이나 폴더의 이름을 지정할 때 이 문자를 포함하지 마십시오.

버킷 생성

버킷은 아래 탭에 설명된 대로 선택한 클라우드 서비스의 인터페이스를 사용하여 생성됩니다.

다음 요구 사항은 두 클라우드 서비스의 버킷과 관련이 있습니다.

  • Bucket name:
    • 버킷 이름은 af-dcr-로 시작해야 합니다.
    • 예시: af-dcr-example-bucket
  • 추가:
    • 앱스플라이어 DCR 서비스에는 버킷 권한이 부여되어야 합니다. 아래의 각 클라우드 서비스에 대한 탭에서 이러한 권한 부여에 대한 지침을 참조하십시오.
    • 버킷은 앱스플라이어 Data Clean Room 전용이어야 합니다. 즉, 다른 서비스는 이 버킷에 데이터를 쓸 수 없습니다.

AWS 버킷

일러두기: 다음 절차는 AWS 관리자가 수행해야 합니다.

버킷 생성 및 앱스플라이어에 권한 부여 방법: 

  1. AWS 콘솔에 로그인합니다.
  2. S3 서비스로 이동합니다.
  3. 버킷 생성 방법:
    1. 버킷 생성(Create Bucket)을 클릭합니다.
    2. af-dcr- 다음에 텍스트가 오는 버킷 이름을 완성합니다(위에서 설명한 대로).
    3. 버킷 생성(Create Bucket)을 클릭합니다.
  4. 앱스플라이어 버킷 권한을 부여하는 방법:
    1. 생성한 버킷을 선택합니다. 
    2. 권한 탭으로 이동합니다. 
    3. 버킷 정책 섹션에서 편집(Edit)을 클릭합니다.버킷 정책 편집 창이 열립니다.
    4. 다음 코드 스니펫을 창에 붙여 넣습니다.
      {
        "Version": "2012-10-17",
        "Statement": [
          {
            "Sid": "AF-DCR",
            "Effect": "Allow",
            "Principal": {
              "AWS": "arn:aws:iam::195229424603:user/product=dcr-reporter__envtype=prod__ns=default"
            },
            "Action": [
              "s3:GetObject",
              "s3:ListBucket",
              "s3:DeleteObject",
              "s3:PutObject"
            ],
            "Resource": [
              "arn:aws:s3:::af-dcr-mybucket",
              "arn:aws:s3:::af-dcr-mybucket/*"
            ]
          }
        ]
      }
      
  5. 스니펫에서 af-dcr-mybucket(표시되는 두 줄)을 생성한 버킷의 이름으로 바꿉니다.
    주의! 스니펫에서 버킷 이름을 바꿀 때 버킷 이름이 나타나는 두 번째 줄의 /*를 덮어쓰지 않도록 하십시오 .

  6. 변경 사항 저장을 클릭합니다.

GCS 버킷

일러두기: 다음 절차는 Google Cloud 관리자가 수행해야 합니다.

버킷 생성 및 앱스플라이어에 권한 부여 방법: 

  1. GCS 콘솔에 로그인합니다.
  2. Cloud Storage 브라우저 페이지로 이동합니다.
  3. 버킷 생성 방법:
    1. 버킷 생성을 클릭합니다.
    2. 버킷 생성 페이지에서 버킷 정보를 입력하십시오. af-dcr-로 시작하고 그 뒤에 텍스트가 오는 버킷 이름을 포함합니다(위에서 설명한 대로).
    3. 계속을 클릭합니다.
    4. 생성을 클릭합니다.
  4. 앱스플라이어 버킷 권한을 부여하는 방법:
    1. 생성한 버킷을 선택합니다. 
    2. 권한 탭으로 이동합니다. 
    3. 권한 섹션에서 + 추가를 클릭합니다.
      회원 추가 창이 열립니다.
    4. 새 회원 상자에 다음 스니펫을 붙여넣습니다.
      appsflyer-dcr@dcr-report.iam.gserviceaccount.com
    5. 역할 목록에서 클라우드 스토리지 > 스토리지 관리자를 선택하십시오.

      dcr_gcs_permissions.png

    6. 저장을 클릭합니다.

DCR 키 폴더 만들기

최대 보안을 보장하려면 버킷 바로 아래에 있는 폴더("DCR 키")의 이름을 계정에 할당된 8자의 영숫자 DCR 키(예: 01bcc5fb )로 지정해야 합니다. 이는 AppsFlyer 계정과 연결된 다른 비밀번호 또는 키와는 다릅니다.

DCR 키 폴더는 일반적으로 선택한 클라우드 서비스의 인터페이스를 사용하여 수동으로 생성합니다.

계정의 DCR 키를 얻으려면 기본 DCR 화면 상단에 있는 DCR 키 버튼을 클릭하십시오.

dcr_key_button.png

 예시

DCR 키 폴더를 생성한 후 버킷/폴더는 다음과 같은 구조를 가져야 합니다.

af-dcr-example-bucket/01bcc5fb/

입력 폴더 경로 만들기

입력 폴더 경로의 각 요소를 생성하기 위한 세부 요구 사항을 아래 탭에서 설명했습니다.

최상위 입력 폴더

필수 사항은 아니지만 가장 좋은 방법은 DCR 키 폴더 바로 아래에 최상위 입력 폴더를 만드는 것입니다. 이 폴더는 DCR에 업로드하는 파일을 위한 전용 폴더입니다.

최상위 입력 폴더는 일반적으로 선택한 클라우드 서비스의 인터페이스를 사용하여 수동으로 생성합니다.

  • 이 방법은 데이터 파일 업로드(입력) 및 보고서 수신(출력)에 동일한 버킷을 사용하는 경우 더욱 강력히 권장됩니다.
  • DCR 이름 지정 요구 사항을 준수하는 조건에서는 이 폴더의 이름을 원하는 대로 지정할 수 있습니다. 쉽게 식별할 수 있도록 일반적으로 이름을 input/로 명명합니다.

 예시

최상위 입력 폴더를 만든 후 버킷/폴더는 다음과 같은 구조를 가질 수 있습니다.

af-dcr-example-bucket/01bcc5fb/input/

각 데이터 소스의 두 번째 수준 폴더

다양한 데이터 소스 파일을 정기적으로 DCR에 업로드하여 처리할 수 있습니다. 이러한 각 데이터 소스에는 별도의 폴더("데이터 소스 폴더")가 할당되어야 합니다.

예를 들어, 매일 처리하기 위해 DCR에 2개의 파일, 즉 BI-data.csvCRM-data.gzip을 업로드하려는 경우, 이러한 각 데이터 소스에 폴더를 할당할 수 있습니다. 이러한 폴더를 BI-data/CRM-data/라고 부를 수 있습니다.

데이터 소스 폴더는 일반적으로 선택한 클라우드 서비스의 인터페이스를 사용하여 수동으로 생성합니다.

 예시

2개의 데이터 소스 폴더를 생성한 후 버킷/폴더는 다음과 같은 구조를 가질 수 있습니다.

af-dcr-example-bucket/01bcc5fb/input/BI-data/
                                     CRM-data/

각 날짜 및 버전에 대해 중첩된 하위 폴더

마침내 실제 작업이 발생하는 폴더 구조 부분에 도달했습니다. 이 폴더는 앱스플라이어가 DCR로 읽을 새 데이터 파일을 지속적으로 찾는 폴더입니다.

앱스플라이어가 데이터 소스 파일을 처리하고 이를 기반으로 리포트를 실행하도록 하려면 날짜 및 버전 번호를 나타내는 일련의 중첩 하위 폴더 내에서 새 버전의 파일을 데이터 소스 폴더로 업로드해야 합니다(앱스플라이어에 데이터 위치를 알려주는 하나의 하위 폴더 추가).

  • 각 데이터 소스 폴더 내 --> 각 날짜에 대한 1개의 하위 폴더("날짜 폴더")
    • 형식: dt=yyyy-mm-dd/
    • 예시: dt=2022-03-10/
  • 각 날짜 폴더 내 --> 해당 날짜의 각 버전에 대한 1개의 하위 폴더("버전 폴더")
    • 형식: v=n/
    • 예시: v=1/
    • 일러두기: 하루에 한 번만 파일을 업로드하더라도 버전 폴더는 필수입니다.
  • 각 버전 폴더 내 --> 데이터 위치를 나타내는 1개의 하위 폴더("데이터 폴더")
    • 형식: data/

대부분의 경우 API 호출 또는 기타 사용 가능한 프로그래밍 방식을 사용하여 데이터 소스 파일이 업로드될 때마다 날짜/버전/데이터 폴더를 자동으로 생성합니다. 추가 정보는 클라우드 서비스에 대한 API 참조( AWS, GCS)를 참조하십시오.

전체 폴더 구조는 파일이 업로드될 때 프로그래밍 방식으로 생성되므로 실제 예에서는 폴더와 파일이 모두 포함됩니다. 아래의 파일 탭에서 이 그림을 참조하십시오.

파일

데이터 소스 파일

업로드된 데이터 소스 파일은 다음 이름, 파일 형식 및 위치 요구 사항을 충족해야 합니다.

  • DCR 이름 지정 요구 사항을 준수해야 합니다.
  • CSV 또는 GZIP 형식. GZIP 압축의 기반 파일은 CSV 파일이어야 합니다.
  • 데이터 폴더당 데이터 소스 파일 수:
    • CSV: 최대 1개
    • GZIP: 최대 1개의 단일 파트 파일. 다중 부분 GZIP 파일은 다음과 같이 이름이 지정될 때 지원됩니다. filename _part01.gzip, filename_part02.gzip 등.

소스 파일 내의 데이터는 다음 요구 사항을 충족해야 합니다.

  • 날짜와 시간:
    • 형식: yyyy-MM-dd hh:mm:ss
    • 시간대: UTC
  • 숫자: 소수점 이하 최대 2자리
  • 문자열 길이: 최대 256자
  • 문자 제한: 없음(모든 문자가 유효함)

 

_SUCCESS 파일

데이터 소스 파일을 데이터 폴더로 업로드하는 것이 완료되면 _SUCCESS라는 빈 파일을 버전 폴더에 업로드해야 합니다. 이를 통해 새 파일을 처리할 수 있음을 앱스플라이어에 알립니다. 대부분의 경우 API 스크립트를 사용하여 이 파일을 자동으로 생성하고 업로드합니다.

중요! _SUCCESS 파일은 데이터 폴더 외부의 버전 폴더에 업로드됩니다.

파일 이름:

  • 모두 대문자여야 합니다.
  • 밑줄(_)이 앞에 와야 합니다.
  • 파일 확장자가 없어야 합니다.

다중 파트 파일의 경우:

  • 모든 파일 부분에 대해 하나의 _SUCCESS 파일만 업로드해야 합니다.
  • _SUCCESS 파일은 모든 파일 부분 업로드가 완료된 후에만 업로드해야 합니다.

 예시

2일 동안 소스 데이터 파일을 업로드하고 프로그래밍 방식으로 날짜/버전/데이터 폴더 및 _SUCCESS 파일을 생성한 후 버킷/폴더는 다음과 같은 구조를 가질 수 있습니다.

af-dcr-example-bucket/01bcc5fb/input/BI-data/
dt=2022-03-10/
v=1/
_SUCCESS
data/
BI-data.csv
dt=2022-03-11/
v=1/
_SUCCESS
data/
BI-data.csv CRM-data/
dt=2022-03-10/
v=1/
_SUCCESS
data/
CRM-data_part01.gzip
CRM-data_part02.gzip
v=2/
_SUCCESS
data/
CRM-data_part01.gzip
CRM-data_part02.gzip
dt=2022-03-11/
v=1/
_SUCCESS
data/
CRM-data_part01.gzip
CRM-data_part02.gzip
v=2/
_SUCCESS
data/
CRM-data_part01.gzip
CRM-data_part02.gzip

출력 폴더 경로 만들기

출력 폴더 경로의 각 요소를 생성하기 위한 세부 요구 사항을 아래 탭에서 설명했습니다.

최상위 출력 폴더

필수 사항은 아니지만 가장 좋은 방법은 DCR 키 폴더 바로 아래에 최상위 출력 폴더를 만드는 것입니다. 이 폴더는 DCR에서 전송되는 리포트 전용입니다.

최상위 출력 폴더는 일반적으로 선택한 클라우드 서비스의 인터페이스를 사용하여 수동으로 생성합니다.

  • 이 방법은 데이터 파일 업로드(입력) 및 보고서 수신(출력)에 동일한 버킷을 사용하는 경우 더욱 강력히 권장됩니다.
  • DCR 이름 지정 요구 사항을 준수하는 조건에서는 이 폴더의 이름을 원하는 대로 지정할 수 있습니다. 쉽게 식별할 수 있도록 일반적으로 이름을 output/로 명명합니다.

 예시

최상위 출력 폴더를 만든 후 버킷/폴더는 다음과 같은 구조를 가질 수 있습니다.

af-dcr-example-bucket/01bcc5fb/output/

각 리포트의 두 번째 수준 폴더

DCR에서 맞춤 설계된 리포트를 원하는 만큼 정기적으로 받을 수 있습니다. 이러한 각 리포트에는 별도의 폴더("리포트 폴더")가 할당되어야 합니다.

따라서 예를 들어 DCR에서 전환 리포트리타게팅 리포트 2개의 리포트를 수신하는 경우 이러한 데이터 소스 각각에 폴더를 할당합니다. 이러한 폴더를 conversions/retargeting/이라고 부를 수 있습니다.

리포트 폴더는 일반적으로 선택한 클라우드 서비스의 인터페이스를 사용하여 수동으로 생성합니다.

 예시

2개의 리포트 폴더를 생성한 후 버킷/폴더는 다음과 같은 구조를 가질 수 있습니다.

af-dcr-example-bucket/01bcc5fb/output/conversions/
                                      retargeting/

각 날짜 및 버전에 대해 중첩된 하위 폴더(고객이 만든 것이 아님)

입력 폴더 경로와 달리 출력 폴더 경로에는 중첩된 날짜/버전 폴더를 생성하지 않습니다. 앱스플라이어는 리포트가 전달될 때마다 이 폴더 구조를 자동으로 생성합니다.

리포트 파일 형식

DCR 리포트는 CSV 형식으로 제공됩니다.