# Import data từ CSV/Excel

## Giới thiệu

Tính năng **Import data từ CSV/Excel** trong nền tảng PangoCDP cho phép người dùng tải lên dữ liệu từ các tệp .csv hoặc .xlsx để đưa vào các mô hình phân tích hoặc hệ thống xử lý dữ liệu.

Đây là một công cụ quan trọng giúp tiết kiệm thời gian khi xử lý dữ liệu số lượng lớn, đặc biệt hữu ích khi cần cập nhật danh sách khách hàng từ hệ thống CRM, nhập dữ liệu từ chiến dịch offline hoặc thêm tập dữ liệu mới phục vụ cho mô hình phân khúc, dự đoán. Nhờ vào khả năng chuẩn hóa và tích hợp linh hoạt, dữ liệu sau khi import sẽ sẵn sàng sử dụng trong các phân hệ khác của PangoCDP mà không cần xử lý thêm.

## Các thao tác thực hiện

### Bước 1: Chuẩn bị file chứa data sẽ cần import vào model

*Ví dụ:  file excel đã chuẩn bị có các trường data như sau:*&#x20;

| STT | Phone      | Tên | PG Pin Code |
| --- | ---------- | --- | ----------- |
| 1   | 0828741234 | A   | 121         |
| 2   | 0987746532 | B   | 122         |
| 3   | 0966236457 | C   | 123         |
| 4   | 0123345455 | D   | 124         |
| 5   | 0224466889 | E   | 125         |

### Bước 2: Tạo model trên Pango CDP với các trường trương ứng cần import

*Ví dụ: model ở đây là “CP test”*

<figure><img src="/files/0zZMv0CcXvGP3gjZPaW9" alt=""><figcaption></figcaption></figure>

### Bước 3: Tạo setup dataset ở PangoCDP

* Truy cập [Module CDP ](https://cdp.mydatalakes.com/)
* Chọn Data Ingestion, nhấn tab Dataset và chọn <img src="/files/5KT5Jjh685Cv0EzkqsbI" alt="" data-size="line">

<figure><img src="/files/nuPz7fdQvnkp6FImCcnR" alt=""><figcaption></figcaption></figure>

* Chọn file cần import từ thiết bị
* Nhấn “Create & Close” để hoàn tất bước import vào dataset

<figure><img src="/files/CaNYP5IQperBo1QyWpsm" alt="" width="500"><figcaption></figcaption></figure>

<table><thead><tr><th width="231.0369873046875">Trường thông tin</th><th>Mô tả</th></tr></thead><tbody><tr><td>Ignore top line</td><td><p>Chọn bỏ dòng 1 là tựa đề data sẽ được tính từ dòng số 2</p><p>(ví dụ: trong excel line 1 là tên cột)</p></td></tr><tr><td>Name</td><td>Đặt tên file khi import lên dataset dùng để quản lý (mặc định là tên của file import)</td></tr><tr><td>Data Model</td><td>Chọn model sẽ import những data ở file excel</td></tr><tr><td>Source Channel</td><td>Chọn kênh là Online hoặc Offline</td></tr><tr><td>Data Source</td><td>Đặt nguồn data để phân biệt và quản lý</td></tr><tr><td>Sub Data Source</td><td>Đặt nguồn data phụ</td></tr><tr><td>Tags</td><td>Gắn nhãn để quản lý</td></tr></tbody></table>

* Mapping các trường ở file excel vừa import và model ở PangoCDP tương ứng => ấn vào icon “Configure the mapping columns”
* Mapping lần lượt các trường tương ứng cho đến hết tất cả các trường data cần import

{% hint style="warning" %} <mark style="color:orange;">Nếu user đã setup 1 file tương tự trước đó rồi có thể chọn “Copy from another dataset” đề tiết kiệm thời gian mapping như hình ảnh minh họa.</mark>

<mark style="color:orange;">Data chưa được push vào model thì chỉ số “#Ingested”=0 nghĩa là chưa có dòng nào được import và số dòng “#Line”=5 nghĩa là có 5 dòng dc thấy trong file excel</mark>
{% endhint %}

<figure><img src="/files/lpdUfgKeYw6gXylr0Y8y" alt=""><figcaption></figcaption></figure>

<figure><img src="/files/vK8gMnAnjAiPt6YrAhSk" alt=""><figcaption></figcaption></figure>

<figure><img src="/files/bTXBJ3WABAp2jTHb5F9v" alt=""><figcaption></figcaption></figure>

<figure><img src="/files/D8HXFeLT1IMpCbu2oWir" alt=""><figcaption></figcaption></figure>

{% hint style="info" %}

* Ở đây sẽ cho chọn copy 1 setup mapping nào đó đã làm từ trước.
* Chọn “Finish” khi đã mapping xong
  {% endhint %}

<figure><img src="/files/83ahYNfa9tmih5flUsoB" alt=""><figcaption></figcaption></figure>

### Bước 4: Push data vào data model:

* Chọn icon <img src="/files/F5nzAQCRaB7yXKBXb1Jb" alt="" data-size="line"> ở “Actions”

<figure><img src="/files/xy58Y67QvaYyfzj8QhC5" alt=""><figcaption></figcaption></figure>

* Thiết lập setup push data qua model
* Bấm **“Ingest”** để thực hiện push data từ dataset vào model
* Khi báo thành công user có thể check được số dòng đã được import vào model (Ở đây số dòng trong file excel là 5 bằng với số dòng đã import được là đẫ import được tất cả dòng)

<figure><img src="/files/FXcnSq5xletxjEllF2zt" alt="" width="563"><figcaption></figcaption></figure>

<table><thead><tr><th width="228.81488037109375">Trường dữ liệu</th><th>Mô tả</th></tr></thead><tbody><tr><td>Id Field</td><td>Chọn trường làm ref id để import (trường duy nhất định danh cho records)</td></tr><tr><td>Fields</td><td>Các trường mở model đã được mapping</td></tr><tr><td>Tags</td><td>Nhãn quản lý, hệ thống sẽ mặc định lấy nhãn lúc import dataset</td></tr><tr><td>Data source</td><td>Nguồn data cũng được lấy ở data source lúc import dataset</td></tr><tr><td>Priority</td><td>Mức độ ưu tiên khi import file vào model: Cao,Vừa và Thấp</td></tr><tr><td>Update Strategy</td><td><p>Chọn loại cập nhật, có 4 loại:</p><ul><li>Ignore if exist: bỏ qua những records đã có refID tồn tại trong model và import những records mới</li><li>Override: cho phép ghi đè toàn bộ trường từ bảng data import vào model nếu có cùng refID</li><li>Update if New Value has Value: Chỉ cập nhật records nếu trường từ bảng data import có giá trị mới so với giá trị cũ nếu records đó có cùng refID</li><li>Update if Old Value no Value: Chỉ cập nhật records nếu trường từ bảng Model cũ (Model được import) không có giá trị nếu records đó có cùng refID</li></ul></td></tr><tr><td>Save this configuration</td><td>Có save setup để dùng cho những lần mapping sau hay không</td></tr></tbody></table>

<figure><img src="/files/G1PrBazYNkyNH1ReMnU8" alt=""><figcaption></figcaption></figure>

### Bước 5: Kiểm tra lại các dữ liệu&#x20;

* Vào Model được import trên [Module CDP](https://cdp.mydatalakes.com/utilities/custom-object-model/M-VEUSE-O-ZTXMX-M) trên PangoCDP
* Ta thấy đã có 5 dòng và data ở những trường tương ứng → Import thành công&#x20;

<figure><img src="/files/y4w9sC4sIwz4UAXgYh2n" alt=""><figcaption></figcaption></figure>

Như vậy là mình đã hoàn thành thao tác Import dữ liệu từ Excel vào hệ thống PangoCDP rồi.


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://help.pangocdp.com/user-guide/module-cdp/data-ingestion/dataset/import-data-tu-csv-excel.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
