요약: 하나 이상의 데이터 웨어하우스(BigQuery, Snowflake) 및/또는 클라우드 스토리지 버킷(Amazon S3, GCS)을 설정하여 Data Clean Room에 데이터를 공유하고 리포트를 수신합니다.
개요
DCR(Data Clean Room) 사용 준비에는 다음 설정이 포함됩니다.
- DCR이 사용자의 시스템에서 퍼스트파티 데이터를 읽는 클라우드 서비스/위치(커스텀 소스). 이러한 위치는 인바운드 연결을 만드는 데 사용됩니다.
- 처리 후 DCR이 리포트를 전달하는 클라우드 서비스/위치입니다. 이러한 위치는 아웃바운드 연결을 만드는 데 사용됩니다.
인바운드 또는 아웃바운드 연결 만들기는 2단계 프로세스입니다.
- 1 단계 – 선택한 클라우드 서비스의 인터페이스를 사용하여 DCR과 함께 사용할 수 있도록 준비합니다(본 기사).
- #2단계 – 앱스플라이어 플랫폼을 사용하여 DCR에 연결합니다. (Data Clean Room - 연결 작업 참조).
참고
Data Clean Room—소스 데이터 요구사항에 대한 전체 정보는 소스 작업을 참조하십시오.
- 데이터 형식(모든 소스용)
- 테이블 열(데이터 웨어하우스의 원본용)
- 파일 이름 및 형식(Cloud Storage 버킷의 소스용)
지원되는 클라우드 서비스
DCR에 대한 인바운드 및 아웃바운드 연결에 두 가지 유형의 클라우드 서비스가 지원됩니다.
- 데이터 웨어하우스: BigQuery와 Snowflake
- 클라우드 스토리지 버킷: Amazon S3 (AWS) 및 GCS
인바운드 및 아웃바운드 연결에 이러한 서비스 중 하나 또는 임의의 조합을 사용할 수 있습니다.
중요!
- 단일 리포트에 여러 커스텀 소스를 사용하려는 경우 해당 소스는 클라우드 저장소 버킷에 있어야 합니다.
- 인바운드 및 아웃바운드 연결 모두에 대해 Amazon S3 또는 GCS에서 동일한 클라우드 스토리지 버킷을 사용하는 것은 매우 일반적입니다. 해당 설정에 대한 특별 지침을 반드시 따라야 합니다.
인바운드 연결을 위한 클라우드 서비스 설정
다음 탭의 지침에 따라 DCR 인바운드 연결에 사용할 클라우드 서비스를 선택하여 준비합니다.
데이터 웨어하우스 – BigQuery와 Snowflake
빅쿼리
일러두기: 다음 절차는 Google Cloud 관리자가 수행해야 합니다.
데이터 세트 생성 및 DCR 권한 부여 방법:
- Google Cloud 콘솔에 로그인합니다.
- BigQuery 페이지로 이동합니다.
- 신규 또는 기존 Google Cloud 프로젝트에서 DCR만 사용할 데이터세트를 생성합니다.
- 왼쪽 패널에서 프로젝트 ID 오른쪽에 있는 액션 보기 버튼
을 클릭합니다.
- 데이터 세트 만들기를 선택합니다.
- 오른쪽 패널이 열리면 데이터 세트의 이름을 입력하고 필요에 따라 다른 옵션을 선택합니다.
- 문자, 숫자 및 밑줄(_)만으로 자신에게 맞는 이름을 사용할 수 있습니다.
- 권장사항: 데이터 세트가 인바운드 연결에 사용되고 있음을 알 수 있는 이름을 사용하십시오.
- 테이블이 만료된 후 DCR이 소스를 읽을 수 없으므로 테이블 만료 활성화 옵션을 사용하지 않는 것이 좋습니다.
- 문자, 숫자 및 밑줄(_)만으로 자신에게 맞는 이름을 사용할 수 있습니다.
-
버튼
을 클릭합니다.
- 왼쪽 패널에서 프로젝트 ID 오른쪽에 있는 액션 보기 버튼
- 다음과 같이 데이터 세트에 대한 DCR 권한을 부여합니다.
- 왼쪽 패널에서 생성한 데이터 세트의 오른쪽에 있는 액션 보기 버튼
을 클릭합니다.
- 공유를 선택합니다.
- 오른쪽 패널이 열리면 버튼
을 클릭합니다.
- 주요 사용자 추가 섹션에서 새 주요 사용자 필드에 다음 계정
appsflyer-dcr@dcr-report.iam.gserviceaccount.com
을 입력합니다. - 역할 할당 섹션에서 BigQuery > BigQuery 메타데이터 뷰어를 선택합니다.
- 저장을 클릭합니다.
- 닫기를 클릭하여 오른쪽 패널을 닫습니다.
- 왼쪽 패널에서 생성한 데이터 세트의 오른쪽에 있는 액션 보기 버튼
Snowflake
참고: Snowflake 계정 관리자가 다음 절차를 수행해야 합니다.
DCR에서 사용할 비공개 공유 생성 방법:
- DCR과 공유하려는 데이터가 포함된Snowflake 계정에 로그인합니다.
- 사용자 역할을 계정 관리자로 전환합니다.
- 왼쪽 패널에서 비공개 공유를 선택합니다.
-
페이지가 열리면 계정에서 공유탭을 선택합니다.
-
공유 버튼을 클릭합니다. 열리는 목록에서 직접 공유 만들기를 선택합니다.
- DCR과 공유하려는 테이블 및/또는 뷰를 선택한 다음 완료를 클릭합니다.
- 필요에 따라 보안 공유 식별자를 변경하고 선택사항으로 설명을 추가합니다.
-
이름으로 사용자 영역의 계정 추가필드에 Snowflake 계정 지역에 따라 다음 앱스플라이어 Snowflake 계정 중 하나를 입력합니다.
Region 앱스플라이어 계정 EU 서부(eu-west-1) QL63117 미국 동부 - 버지니아 북부(us-east-1) MWB70410 미국 동부 - 오하이오(us-east-2) BM15378 - 공유 만들기 버튼을 클릭합니다.
클라우드 스토리지 버킷 – Amazon S3 및 GCS
하나 이상의 버킷을 사용하여 DCR에 데이터를 업로드할 수 있습니다(Amazon S3, GCS 또는 둘 다). 그러나 대부분의 경우 가장 관리하기 쉬운 구조에는 단일 클라우드 서비스의 단일 버킷이 포함됩니다.
- 다음 지침에 따라 인바운드 및 아웃바운드 연결 모두에 동일한 버킷을 설정할 수 있습니다.
다음 요구 사항은 두 클라우드 서비스의 버킷과 관련이 있습니다.
- 사용: 버킷은 앱스플라이어 Data Clean Room 전용이어야 합니다. 즉, 다른 서비스는 이 버킷에 데이터를 쓸 수 없습니다.
- 권한: 앱스플라이어 DCR 서비스에는 버킷 권한이 부여되어야 합니다. 아래의 각 클라우드 서비스에 대한 탭에서 이러한 권한 부여에 대한 지침을 참조하십시오.
-
이름: 버킷 이름은
af-dcr-
또는af-datalocker-
로 시작해야 합니다.- 예시:
af-dcr-example-bucket
- 예시:
-
DCR 이름 지정 요구 사항: 다음 이름 지정 요구 사항은 모든 DCR 데이터 엔터티(버킷, 폴더 및 파일)에 적용됩니다.
- 최대 길이: 200자
- 유효한 문자:
- 문자
(A-Z, a-z)
- 숫자
(0-9)
, 이름의 첫 문자가 될 수 없습니다. - 하이픈
(-)
이름의 첫 번째 문자가 될 수 없습니다. - 유효하지 않은 문자:
- 공백
- 기타 모든 기호 또는 특수 문자
- 특별한 목적으로만 사용되는 문자:
-
- 등호
(=)
, 날짜 및 버전 폴더 이름에서 필요한 경우에만 - 밑줄
(_)
, 다중 부분 GZIP 파일의 일부를 식별하거나 _SUCCESS 파일의 이름을 지정하는 데 사용되는 경우에만 - 점
(.)
, 파일 이름 확장자(.csv, .gzip)
바로 앞
- 등호
-
- 문자
Amazon S3
일러두기: 다음 절차는 AWS 관리자가 수행해야 합니다.
버킷 생성 및 앱스플라이어에 권한 부여 방법:
- AWS 콘솔에 로그인합니다.
- S3 서비스로 이동합니다.
- 버킷 생성 방법:
- 버킷 생성(Create Bucket)을 클릭합니다.
- 버킷 이름을
af-dcr-
또는af-datalocker-
로 시작하고 텍스트를 입력하여 완성합니다(위의 DCR 이름 지정 요구 사항에 따라). - 버킷 생성(Create Bucket)을 클릭합니다.
- 앱스플라이어 버킷 권한 부여 방법:
- 생성한 버킷을 선택합니다.
- 권한 탭으로 이동합니다.
- 버킷 정책 섹션에서 편집(Edit)을 클릭합니다.버킷 정책 편집 창이 열립니다.
- 다음 코드 스니펫을 창에 붙여 넣습니다.
{ "Version": "2012-10-17", "Statement": [ { "Sid": "AF-DCR-DL", "Effect": "Allow", "Principal": { "AWS": [ "arn:aws:iam::195229424603:user/product=dcr-reporter__envtype=prod__ns=default", "arn:aws:iam::195229424603:user/product=datalocker__envtype=prod__ns=default" ] }, "Action": [ "s3:GetObject", "s3:ListBucket", "s3:DeleteObject", "s3:PutObject" ], "Resource": [ "arn:aws:s3:::af-dcr-mybucket", "arn:aws:s3:::af-dcr-mybucket/*" ] } ] }
-
스니펫에서
af-dcr-mybucket
(표시되는 두 줄)을 생성한 버킷의 이름으로 바꿉니다.
주의! 스니펫에서 버킷 이름을 바꿀 때 버킷 이름이 나타나는 두 번째 줄의/*
를 덮어쓰지 않도록 하십시오 . -
변경 사항 저장을 클릭합니다.
GCS
일러두기: 다음 절차는 Google Cloud 관리자가 수행해야 합니다.
버킷 생성 및 앱스플라이어에 권한 부여 방법:
- GCS 콘솔에 로그인합니다.
- Cloud Storage 브라우저 페이지로 이동합니다.
- 버킷 생성 방법:
- 버킷 생성을 클릭합니다.
- 버킷 생성 페이지에서 버킷 정보를 입력하십시오. 버킷 이름을
af-dcr-
또는af-datalocker-
로 시작하고 텍스트를 입력하여 포함합니다(위의 DCR 이름 지정 요구 사항에 따라). - 계속을 클릭합니다.
- 생성을 클릭합니다.
- 앱스플라이어 버킷 권한 부여 방법:
- 생성한 버킷을 선택합니다.
- 권한 탭으로 이동합니다.
- 권한 섹션에서 + 추가를 클릭합니다.
회원 추가 창이 열립니다. - 새 구성원 상자에 다음 계정
appsflyer-dcr@dcr-report.iam.gserviceaccount.com
을 입력합니다. - 역할 목록에서 클라우드 스토리지 > 스토리지 관리자를 선택하십시오.
- 저장을 클릭합니다.
아웃바운드 연결을 위한 클라우드 서비스 설정
DCR은 앱스플라이어 데이터 락커를 사용하여 선택한 클라우드 서비스에 리포트를 제공합니다.
- 참고: DCR 리포트를 수신하는 데 데이터 락커에 대한 프리미엄 구독이 필요하지 않습니다. 데이터 락커를 통해 다른 앱스플라이어 리포트를 수신하려면 CSM에 문의하거나 hello@appsflyer.com로 이메일을 보내주십시오.
DCR 리포트는 클라우드 서비스의 하나 이상의 위치로 전달될 수 있습니다(인바운드 연결에 동일한 서비스를 사용하는지 여부에 관계없이). 다음 탭의 지침에 따라 아웃바운드 연결과 함께 사용할 수 있도록 준비합니다.
데이터 웨어하우스 – BigQuery와 Snowflake
빅쿼리
일러두기: 다음 절차는 Google Cloud 관리자가 수행해야 합니다.
데이터 세트 생성 및 데이터 락커 권한 부여 방법:
- Google Cloud 콘솔에 로그인합니다.
- BigQuery 페이지로 이동합니다.
- 신규 또는 기존 Google Cloud 프로젝트에서 데이터 락커에서만 사용할 데이터세트를 생성합니다.
- 왼쪽 패널에서 프로젝트 ID 오른쪽에 있는 액션 보기 버튼
을 클릭합니다.
- 데이터 세트 만들기를 선택합니다.
- 오른쪽 패널이 열리면 데이터 세트의 이름을 입력하고 필요에 따라 다른 옵션을 선택합니다.
- 문자, 숫자 및 밑줄(_)만으로 자신에게 맞는 이름을 사용할 수 있습니다.
- 권장사항: 데이터 세트가 아웃바운드 연결에 사용되고 있음을 알 수 있는 이름을 사용하십시오.
- 테이블이 만료된 후 데이터 락커는 데이터 세트에 대한 리포트를 쓸 수 없으므로 테이블 만료 활성화 옵션을 사용하지 않는 것이 좋습니다.
- 문자, 숫자 및 밑줄(_)만으로 자신에게 맞는 이름을 사용할 수 있습니다.
-
버튼
을 클릭합니다.
- 왼쪽 패널에서 프로젝트 ID 오른쪽에 있는 액션 보기 버튼
- 데이터 세트에 대한 데이터 락커 권한 부여 방법:
- 왼쪽 패널에서 생성한 데이터 세트의 오른쪽에 있는 액션 보기 버튼
을 클릭합니다.
- 공유를 선택합니다.
- 오른쪽 패널이 열리면 버튼
을 클릭합니다.
- 주요 사용자 추가 섹션에서 새 주요 사용자 필드에 다음 계정
datalocker-bq-admin-prod@datalocker-bq-prod.iam.gserviceaccount.com
을 입력합니다. - 역할 할당 섹션에서 BigQuery > BigQuery 데이터 편집기를 선택합니다.
- 저장을 클릭합니다.
- 닫기를 클릭하여 오른쪽 패널을 닫습니다.
- 왼쪽 패널에서 생성한 데이터 세트의 오른쪽에 있는 액션 보기 버튼
Snowflake
클라우드 스토리지 버킷 – Amazon S3 및 GCS
아웃바운드 연결을 위해 클라우드 스토리지 버킷을 준비하는 절차는 인바운드 연결을 위해 준비하는 절차와 매우 유사합니다(두 클라우드 스토리지 서비스와 관련된 지침 포함).
아래 탭의 지침은 아웃바운드 연결에만 버킷을 사용하는 경우에 적용됩니다.
- 인바운드 및 아웃바운드 연결 모두에 동일한 버킷을 사용하는 경우 해당 설정에 대한 특별 지침을 따릅니다.
Amazon S3
인바운드 연결을 위한 Amazon S3 버킷 생성 지침을 따르십시오(해당 절차는 변경하지 않음).
GCS
인바운드 연결을 위한 GCS 버킷 생성 안내를 따르십시오. 해당 절차의 4단계에서 새 구성원 상자에 다음 계정af-data-delivery@af-raw-data.iam.gserviceaccount.com
을 입력합니다.
인바운드 및 아웃바운드 연결 모두에 대해 동일한 클라우드 저장소 버킷 설정
앞서 언급했듯이 인바운드 및 아웃바운드 연결 모두에 대해 Amazon S3 또는 GCS에서 동일한 버킷을 사용하는 것이 일반적입니다.
이 설정에 대한 지침은 인바운드 연결에 대한 지침과 약간만 다릅니다. 그러나 다음과 같은 경우에 따라 다릅니다.
- DCR 인바운드 및 아웃바운드 연결에 사용할 새 버킷 생성; 또는
- 이전에 데이터 락커에만 사용되었던 버킷을 인바운드 및 아웃바운드 DCR 연결 모두에 사용되는 버킷으로 수정
이 두 시나리오에 대한 지침은 아래 탭에 포함되어 있습니다.
Amazon S3
인바운드/아웃바운드 연결을 위한 새 버킷 생성
인바운드 연결을 위한 Amazon S3 버킷 생성 지침을 따르십시오(해당 절차는 변경하지 않음).
이전에 데이터 락커에만 사용되었던 기존 버킷 수정
이전에 데이터 락커에만 사용했던 기존 버킷을 수정하려면 버킷 권한을 변경해야 합니다(DCR과 데이터 락커 모두에 대한 액세스 허용).
버킷 권한 변경 방법:
- AWS 콘솔에 로그인합니다.
- S3 서비스로 이동합니다.
- 이전에 데이터 락커에만 사용된 버킷을 선택합니다.
- 권한 탭으로 이동합니다.
- 버킷 정책 섹션에서 편집(Edit)을 클릭합니다.버킷 정책 편집 창이 열립니다.
-
기간의 내용을 다음 코드 조각으로 바꿉니다.
{ "Version": "2012-10-17", "Statement": [ { "Sid": "AF-DCR-DL", "Effect": "Allow", "Principal": { "AWS": [ "arn:aws:iam::195229424603:user/product=dcr-reporter__envtype=prod__ns=default", "arn:aws:iam::195229424603:user/product=datalocker__envtype=prod__ns=default" ] }, "Action": [ "s3:GetObject", "s3:ListBucket", "s3:DeleteObject", "s3:PutObject" ], "Resource": [ "arn:aws:s3:::af-dcr-mybucket", "arn:aws:s3:::af-dcr-mybucket/*" ] } ] }
- 스니펫에서
af-dcr-mybucket
(표시되는 두 줄)을 생성한 버킷의 이름으로 바꿉니다. -
주의! 스니펫에서 버킷 이름을 바꿀 때 버킷 이름이 나타나는 두 번째 줄의
/*
를 덮어쓰지 않도록 하십시오 .
- 스니펫에서
- 변경 사항 저장을 클릭합니다.
GCS
인바운드/아웃바운드 연결을 위한 새 버킷 생성
인바운드 연결을 위한 GCS 버킷 생성 안내를 따르십시오. 이 절차의 4단계를 수정해 새 구성원 상자에 다음 2개의 계정appsflyer-dcr@dcr-report.iam.gserviceaccount.com
을 입력합니다.af-data-delivery@af-raw-data.iam.gserviceaccount.com
이전에 데이터 락커에만 사용되었던 기존 버킷 수정
이전에 데이터 락커에만 사용했던 기존 버킷을 수정하려면 버킷 권한을 변경해야 합니다(DCR과 데이터 락커 모두에 대한 액세스 허용).
버킷 권한 변경 방법:
- GCS 콘솔에 로그인합니다.
- Cloud Storage 브라우저 페이지로 이동합니다.
- 이전에 데이터 락커에만 사용된 버킷을 선택합니다.
- 권한 탭으로 이동합니다.
- 권한 섹션에서 + 추가를 클릭합니다.
회원 추가 창이 열립니다. - 새 구성원 상자에 다음 계정
appsflyer-dcr@dcr-report.iam.gserviceaccount.com
을 입력합니다. - 역할 목록에서 클라우드 스토리지 > 스토리지 관리자를 선택하십시오.
- 저장을 클릭합니다.