Import data từ Google Drive
Tài liệu hướng dẫn bạn nắm thao tác cách import một danh sách các files từ 1 tệp có trên Google Drive vào hệ thống PangoCDP.
Last updated
Was this helpful?
Tài liệu hướng dẫn bạn nắm thao tác cách import một danh sách các files từ 1 tệp có trên Google Drive vào hệ thống PangoCDP.
Last updated
Was this helpful?
Tạo theo hướng dẫn
Truy cập
Chọn Data Ingestion, nhấn vào tab Dataset, chọn File Form Your Cloud
Chọn Model mà user cần đẩy data vào
Chọn “Select a file”
Chọn Cloud Storage Service Provider là Google Drive
Chọn kết nối mong muốn
Chọn file sẽ được đẩy data vào model và sync data để Pango CDP cập nhật data trên Google Drive nếu ở đó chưa có records nào
Chọn “Select” để chọn file; Lưu ý để file được hệ thống đọc được thì phải có định dạng như: *.xlsx và *.csv
Chọn “View Sample” để xem data mẫu có trong file nếu đã đúng chọn “Next”
Điền những thông tin cần thiết rồi chọn “Create & Close”
Chọn "Ingest data form a folder into CDP"
Chọn folder trên Drive
Chọn cloud storage
Chọn kết nối
Chọn folder chứa files
Chọn tên file theo cấu trúc
Cấu hình tiếp tục những mục đánh số rồi Save lại
Đặt lịch sync Schedual (Now & Schedule)
Lưu ý: Tất cả những file cần import vào hệ thống cần tuân theo những quy luật sau:
Hệ thống chỉ hổ trợ 2 định dạng là: *.csv và *.xlsx
Đặt tên file trên Drive theo cấu trúc như: name_YYYYMMDD_text.xlsx Vd: như hình trên đang chọn matching file name là “hot_sale” thì tên những files ở Drive sẽ là hot_sale_20231206_01.xlsx; hot_sale_20231206_02.xlsx; hot_sale_20231207_01.xlsx;....
>> Ngày tháng đặt ở đây là quan trọng vì sẽ ảnh hưởng đến khả năng matching của hệ thống và Drive
Matching file name
Tên file đã có đề cập ở trên
To lines - Total x lines
Số dòng tối đa hệ thống sẽ sync về model; Nếu lấy tất cả record thì chọn “-1” ở đó
Id Field
Ref ID dùng để import vào mode có thể chọn 1 trường của dataset (lưu ý trường này phải là duy nhất ở các record) hoặc chọn cho hệ thống tự tạo refID bằng cách check “Auto generate”
Tags
Tags quản lý
Data source
Tên nguồn data
Priority
Mức độ ưu tiên khi có job import vào model; có 3 mức: cao, vừa và thấp, thường sẽ chọn mức Medium
Update Strategy
Chọn loại cập nhật, có 4 loại:
Ignore if exist: bỏ qua những records đã có refID tồn tại trong model và import những records mới
Override: cho phép ghi đè toàn bộ trường từ bảng data import vào model nếu có cùng refID
Update if New Value has Value: Chỉ cập nhật records nếu trường từ bảng data import có giá trị mới so với giá trị cũ nếu records đó có cùng refID
Update if Old Value no Value: Chỉ cập nhật records nếu trường từ bảng Model cũ (Model được import) không có giá trị nếu records đó có cùng refID
Chọn View Task
Chọn History
Lưu ý:
Những files có trong History sẽ không được hệ thống trigger nữa
Có thể xóa files trong History nếu muốn hệ thống trigger lại file đó 1 lần nữa
Chỉ có 1 chiều sync dữ liệu từ Google Drive về PangoCDP, không có chiều ngược lại từ PangoCDP lên Google Drive
Mapping những trường data tương ứng giữa file và model bằng cách chọn icon