🎉

Chúc mừng — ĐẠT!

☕ Về tác giả & Ủng hộ

👋 Dương Ngọc Quang Tâm

Data Solution Architect, ~10 năm trong nghề dữ liệu: kiến trúc & nền tảng dữ liệu trên cloud (AWS, Databricks), streaming thời gian thực (Kafka, Flink), xử lý big data (Spark) & full-stack. Từng dẫn dắt team data ở mảng fintech & gaming; học kỹ thuật theo chương trình Đức. Hiện sống ở TP.HCM.

Khóa này là side project cá nhân — mình làm về dữ liệu chứ không làm privacy/DPO. Nó bắt nguồn từ một người bạn làm DPO nhưng chưa có nền data literacy, nhờ mình chỉ. Thế là mình soạn hẳn thành khóa, để các bạn business/non-tech đỡ ngợp về data literacy (hiểu dữ liệu, biết nói chuyện với IT) phục vụ công việc privacy/DPO. 🙂

Data Literacy cho DPO tương lai

Từ người mới tinh, non-tech → đủ nền tảng dữ liệu để tự tin làm việc với IT và làm tốt vai trò Data Protection Officer.

📚 Xương sống DAMA-DMBOK 🔐 Trọng tâm Privacy 🏦 Ví dụ ngân hàng 🛠️ Template & ROPA
Tài liệu do cá nhân tự biên soạn · không thay thế tư vấn pháp lý · ví dụ dùng dữ liệu giả

Tài liệu này dành cho ai?

Cho người làm business / non-technical — đặc biệt là người làm bảo vệ dữ liệu cá nhân (privacy) — chưa từng học về dữ liệu một cách bài bản. Bạn không cần biết lập trình. Mục tiêu là sau khi đọc, bạn:

  • Nắm được các khái niệm dữ liệu nền tảng, nói cùng "ngôn ngữ" với dân kỹ thuật.
  • Hiểu vì sao IT lại hỏi bạn những câu như "data này lưu ở đâu, ai truy cập, có mã hóa không" — và biết trả lời thế nào.
  • Biết cách tự làm data mapping và lập ROPA phục vụ tuân thủ PDPL.
📖 Cách đọc tài liệu này

Đây là một giáo trình tự học chia làm 5 module, tổng cộng khoảng 10.5 giờ. Mỗi module có bài tập tự luận và một bài trắc nghiệm chấm điểm (đáp án gợi ý ở phụ lục cuối). Mỗi bài học đều có các khối màu giúp bạn định hướng:

💡 Ví dụ ngân hàng 🔍 Tại sao IT hỏi ⚠️ Lưu ý privacy 📖 Định nghĩa  🔑 Ghi nhớ, ✎ Bài tập, ❓ FAQ.

🗺️ Lộ trình học (~10.5 giờ)

Bạn có thể học rải trong vài ngày. Gợi ý chia buổi:

ModuleNội dung chínhBàiThời lượng
1. Nền tảng dữ liệuDữ liệu là gì, DAMA-DMBOK, vòng đời, quản trị, chất lượng, metadata, vai trò1–8~2 giờ
2. Hiểu thế giới ITServer, database, SQL, cloud, tích hợp, security, an ninh mạng, ITGC/ITAC, ISO 270019–18~3 giờ
3. Privacy thực chiếnNguyên tắc, căn cứ pháp lý, data flow/inventory/mapping, ROPA, DPIA, quyền chủ thể, bên thứ ba, sự cố, luật VN19–29~3 giờ
4. Mở rộngPhân tích dữ liệu & BI, AI và dữ liệu lớn, case study tổng hợp30–32~1 giờ
5. Trở thành DPODeep-dive vai trò DPO, ma trận RACI, mức độ hiểu data cần thiết & lộ trình sự nghiệp33–35~1.5 giờ
Mục tiêu cuối khóa: tự tin nói chuyện với IT bằng đúng thuật ngữ, hiểu vì sao họ hỏi từng câu, và tự tay làm được data mapping → ROPA cho một quy trình ngân hàng theo pháp luật Việt Nam.

🧭 Học tuần tự hay độc lập? Cách dùng "trình chiếu"

📖 Khuyến nghị lộ trình

Khóa được trình bày dạng trình chiếu (slide): bạn bấm ◀ Trước / Tiếp ▶ ở thanh dưới (hoặc phím mũi tên ←/→) để đi từng bài, thay vì cuộn dài. Mỗi bài chỉ chiếm một màn hình.

  • Khuyến nghị: học TUẦN TỰ. Module 1 (nền tảng) là điều kiện tiên quyết cho mọi module sau; Module 2 (IT) hỗ trợ Module 3 (privacy). Kiến thức xây chồng lên nhau.
  • Có thể đọc tương đối độc lập: Module 5 (vai trò DPO) có thể xem sớm để lấy động lực; Module 4 (BI/AI) khá độc lập. Nhưng để làm bài tập & trắc nghiệm tốt thì vẫn nên qua Module 1–3 trước.

🚧 Trắc nghiệm là "guard rail": mỗi module khóa lại cho đến khi bạn đậu bài trắc nghiệm (≥ 7/10) của module liền trước. Trong một module đã mở, bạn được đi tới-lui các bài tự do. Cơ chế này đảm bảo bạn không "nhảy cóc" qua kiến thức nền.

💾 Tiến độ được lưu tự động

Bài đã xem, trắc nghiệm đã đậu & vị trí đang học của bạn được lưu ngay trên trình duyệt này (localStorage). Lần sau mở lại trang bằng đúng trình duyệt & thiết bị này, bạn sẽ được đưa về đúng chỗ đang học dở, giữ nguyên các module đã mở khóa và dấu ✓ các bài đã xem.

Lưu ý: tiến độ không theo bạn sang máy/trình duyệt khác. Mở bằng máy khác, trình duyệt khác, chế độ ẩn danh, hay xóa dữ liệu duyệt web → tiến độ sẽ về 0. 🔄 Đặt lại tiến độ

Module 1 ~2 giờ

Nền tảng Data Literacy

Hiểu bản chất dữ liệu và bộ khung quản trị chuẩn quốc tế DAMA-DMBOK — nền móng cho mọi thứ phía sau.

1. Dữ liệu là gì? ↑ đầu trang

⏱ ~12 phút · Viên gạch đầu tiên — phân biệt dữ liệu, thông tin & các dạng dữ liệu

Hãy bắt đầu từ thứ cơ bản nhất. Dữ liệu (data) là những sự kiện thô, rời rạc, chưa có ý nghĩa nếu đứng một mình.

Thang DIKW: từ dữ liệu đến tri thức

Người trong ngành hay nói về thang DIKW — bốn bậc cho thấy dữ liệu "lớn lên" thành giá trị thế nào:

BậcLà gìVí dụ ngân hàng
Data (dữ liệu)Con số/sự kiện thô15.000.000
Information (thông tin)Dữ liệu có ngữ cảnhSố dư tài khoản của KH Nguyễn Văn A là 15.000.000đ
Knowledge (tri thức)Hiểu được quy luật, mối liên hệKH A thường giữ số dư cao vào cuối tháng
Wisdom (sự khôn ngoan)Ra quyết định đúng từ tri thứcNên giới thiệu sản phẩm tiết kiệm cho nhóm KH như A
⚠️ Lưu ý privacy

Một con số như 15.000.000 là vô hại. Nhưng khi gắn với một con người cụ thể (KH A), nó trở thành dữ liệu cá nhân cần bảo vệ. Privacy quan tâm đúng cái khoảnh khắc "dữ liệu thô" biến thành "thông tin về một người".

Ba dạng dữ liệu theo cấu trúc

Có cấu trúc (structured)

Sắp gọn theo hàng–cột như bảng Excel hay cơ sở dữ liệu. Dễ tìm, dễ lọc.

VD: bảng khách hàng có cột Tên, CCCD, SĐT, số dư.

Bán cấu trúc (semi-structured)

Có một ít quy tắc nhưng không cứng nhắc như bảng. Thường là file JSON/XML, email.

VD: log giao dịch, file API trả về.

Phi cấu trúc (unstructured)

Không theo khuôn nào: ảnh, PDF, ghi âm cuộc gọi, ảnh chụp CCCD.

VD: ảnh eKYC, file ghi âm tổng đài.

Metadata — "dữ liệu về dữ liệu"

Thông tin mô tả dữ liệu khác: ai tạo, khi nào, định dạng, ai được xem.

VD: ảnh CCCD chụp lúc 10:05, bởi nhân viên X, lưu 5 năm.

Hai khái niệm cuối cũng hay gặp: Master data (dữ liệu lõi, ít đổi — như danh mục khách hàng, sản phẩm) và Transaction data (dữ liệu giao dịch, sinh liên tục — như từng lần chuyển tiền).

🔍 Tại sao IT hỏi

Khi IT hỏi "data của chị là structured hay unstructured?" — họ đang muốn biết dữ liệu nằm ở đâu (database hay kho file/ảnh) để biết cách kiểm soát truy cập và mã hóa. Ảnh CCCD (phi cấu trúc) bảo vệ khác với một cột số điện thoại trong database.

2. DAMA-DMBOK & DAMA Wheel ↑ đầu trang

⏱ ~15 phút · Bộ khung chuẩn quốc tế & chỗ đứng của privacy trong đó

Quản trị dữ liệu (data management) là việc tổ chức bài bản để dữ liệu luôn đúng, an toàn, dùng được và tuân thủ pháp luật. DAMA là hiệp hội quốc tế về quản trị dữ liệu; họ xuất bản cuốn DMBOK (Data Management Body of Knowledge) — được xem là "cẩm nang chuẩn" của ngành.

DMBOK chia công việc dữ liệu thành 11 lĩnh vực (knowledge areas), vẽ thành một vòng tròn gọi là DAMA Wheel, với Data Governance (Quản trị dữ liệu) ở trung tâm điều phối tất cả.

Data Governance (trung tâm) DataSecurity DataQuality Meta-data DW &BI Ref &Master Doc &Content DataInteg. Storage& Ops DataArch. DataModeling
DAMA Wheel — Data Governance ở trung tâm + 10 lĩnh vực xung quanh (tổng 11 theo DMBOK2)
Lĩnh vực (knowledge area)Nói ngắn gọnPrivacy?
Data Governance — Quản trị dữ liệuĐặt chính sách, vai trò, quyết định "ai được làm gì với dữ liệu". Trung tâm của mọi thứ.★★★
Data Security — An ninh dữ liệuBảo vệ dữ liệu khỏi truy cập trái phép (mã hóa, phân quyền).★★★
MetadataQuản lý "dữ liệu về dữ liệu" — biết bạn đang có gì, ở đâu, ý nghĩa gì.★★★
Data Quality — Chất lượng dữ liệuĐảm bảo dữ liệu đúng, đầy đủ, cập nhật.★★
Reference & Master DataQuản lý dữ liệu lõi dùng chung (khách hàng, sản phẩm).★★
Data Architecture — Kiến trúc dữ liệuBản thiết kế tổng thể dữ liệu chảy qua hệ thống nào.★★
Data Modeling & DesignThiết kế cấu trúc bảng/quan hệ dữ liệu.
Data Storage & OperationsLưu trữ, vận hành, sao lưu database.★★
Data Integration & InteroperabilityKết nối, di chuyển dữ liệu giữa các hệ thống (ETL, API).★★
Document & Content MgmtQuản lý tài liệu, file phi cấu trúc.★★
Data Warehousing & BIGom dữ liệu để phân tích, báo cáo.

Lưu ý: DMBOK không có một lĩnh vực tên "Privacy" riêng — privacy nằm xuyên suốt, mạnh nhất ở Governance, Security và Metadata. Đó là lý do người làm privacy cần hiểu cả bức tranh, không chỉ phần bảo mật.

3. Vòng đời dữ liệu (data lifecycle) ↑ đầu trang

⏱ ~12 phút · Dữ liệu đi qua những giai đoạn nào & rủi ro privacy ở mỗi giai đoạn

Dữ liệu cá nhân không "đứng yên" — nó đi qua nhiều giai đoạn. Privacy quan tâm rủi ro ở từng giai đoạn.

📥Thu thậpCollect
🗄️Lưu trữStore
⚙️Sử dụngUse
🔁Chia sẻShare
📦Lưu lâu dàiArchive
🗑️HủyDestroy
Giai đoạnRủi ro privacy điển hình
Thu thậpThu nhiều hơn cần (vi phạm nguyên tắc tối thiểu hóa); chưa có sự đồng ý.
Lưu trữLưu không mã hóa; lưu ở quốc gia khác mà chưa có hồ sơ chuyển dữ liệu.
Sử dụngDùng sai mục đích so với lúc thu thập; quá nhiều người truy cập.
Chia sẻĐưa cho bên thứ ba/đối tác mà chưa ràng buộc hợp đồng bảo vệ dữ liệu.
Lưu lâu dàiGiữ quá thời hạn cần thiết.
HủyXóa không triệt để; bản sao lưu (backup) vẫn còn dữ liệu.
💡 Ví dụ ngân hàng

Ảnh CCCD khách hàng chụp khi mở thẻ: thu thập qua app eKYC → lưu ở kho ảnh → dùng để định danh → chia sẻ với đối tác chấm điểm tín dụng → lưu theo quy định lưu trữ → hủy khi hết thời hạn. Mỗi mũi tên là một điểm bạn cần kiểm soát.

4. Quản trị dữ liệu (Data Governance) ↑ đầu trang

⏱ ~15 phút · Trái tim của DAMA Wheel — và là nơi privacy "sống"

📖 Định nghĩa

Quản trị dữ liệu (Data Governance) là tập hợp chính sách, quy trình, vai trò và quyền quyết định để đảm bảo dữ liệu được quản lý như một tài sản của tổ chức: đúng, an toàn, dùng đúng mục đích và tuân thủ pháp luật. Nói ngắn: nó trả lời câu hỏi "Ai được quyết định gì về dữ liệu, theo luật chơi nào?"

Nếu các lĩnh vực khác trong DAMA Wheel là "làm việc với dữ liệu", thì Governance là "đặt ra luật chơi" cho tất cả. Đây là lý do nó nằm ở trung tâm. Với người làm privacy, Governance chính là sân nhà: chính sách bảo vệ dữ liệu cá nhân, phân quyền, ROPA... đều là sản phẩm của Governance.

Ba trụ cột của một chương trình Governance

1
Con người & vai trò
Ai chịu trách nhiệm (Owner, Steward, DPO...)
2
Chính sách & chuẩn
Quy định bằng văn bản: phân loại, lưu trữ, truy cập
3
Quy trình & công cụ
Cách thực thi: data catalog, quy trình duyệt truy cập

Những thành phần bạn sẽ nghe nhắc tới

Thuật ngữLà gì
Data Governance Council
(Hội đồng quản trị dữ liệu)
Nhóm lãnh đạo liên phòng ban ra quyết định & phê duyệt chính sách dữ liệu cấp cao.
Data Policy (Chính sách dữ liệu)Văn bản quy định nguyên tắc bắt buộc (vd "dữ liệu cá nhân phải được mã hóa khi lưu").
Data Standard (Chuẩn dữ liệu)Quy ước cụ thể: định dạng ngày, cách viết tên, mã quốc gia...
Data Catalog (Danh mục dữ liệu)"Thư viện tra cứu" liệt kê dữ liệu tổ chức có, ý nghĩa & nơi lưu (xem mục Metadata & Data Catalog).
Business Glossary (Từ điển nghiệp vụ)Định nghĩa thống nhất các thuật ngữ (vd "khách hàng hoạt động" nghĩa là gì).
💡 Ví dụ ngân hàng

Hai phòng định nghĩa "khách hàng đang hoạt động" khác nhau: phòng A tính "có giao dịch trong 30 ngày", phòng B tính "90 ngày". Báo cáo gửi lãnh đạo vênh nhau → mất niềm tin vào số liệu. Governance giải quyết bằng Business Glossary: chốt một định nghĩa duy nhất cho toàn ngân hàng.

🔑 Ghi nhớ

Privacy không thể tồn tại nếu không có Governance. Bạn cần một "bộ luật chơi" rõ ràng (ai sở hữu dữ liệu, phân loại thế nào, lưu bao lâu) thì mới áp được các nghĩa vụ bảo vệ dữ liệu cá nhân lên đó.

5. Chất lượng dữ liệu (Data Quality) ↑ đầu trang

⏱ ~15 phút · "Rác vào, rác ra" — dữ liệu sai làm hỏng cả quyết định lẫn quyền của khách hàng

Dữ liệu chỉ có giá trị khi đáng tin. Ngành dữ liệu đánh giá chất lượng theo 6 chiều (dimensions):

Chiều chất lượngNghĩaVí dụ lỗi ở ngân hàng
Accuracy — Chính xácDữ liệu phản ánh đúng thực tếSố CCCD nhập sai một chữ số
Completeness — Đầy đủKhông thiếu trường bắt buộcHồ sơ thiếu số điện thoại
Consistency — Nhất quánGiống nhau giữa các hệ thốngĐịa chỉ ở app khác với ở core banking
Timeliness — Kịp thờiCập nhật đủ mớiKhách đổi số ĐT 6 tháng trước, hệ thống vẫn số cũ
Uniqueness — Duy nhấtKhông trùng lặpMột khách hàng bị tạo 3 hồ sơ (CIF) khác nhau
Validity — Hợp lệĐúng định dạng/quy tắcNgày sinh ghi 31/02; email không có "@"
⚠️ Lưu ý privacy

Chất lượng dữ liệu chính là một nghĩa vụ privacy: pháp luật bảo vệ dữ liệu cá nhân yêu cầu dữ liệu phải chính xác và cập nhật (nguyên tắc "tính chính xác" — xem mục Nguyên tắc bảo vệ DLCN). Dữ liệu sai có thể khiến khách hàng bị từ chối khoản vay oan, hoặc nhận thông báo của người khác → vi phạm quyền của họ.

❓ FAQ

Hỏi: Đo chất lượng dữ liệu bằng gì?
Đáp: Bằng các "luật kiểm tra" (data quality rules) tự động — ví dụ "100% hồ sơ phải có CCCD hợp lệ" — rồi tính tỷ lệ đạt. IT thường gọi đây là data profiling (khảo sát dữ liệu).

6. Metadata & Data Catalog ↑ đầu trang

⏱ ~12 phút · "Bạn không thể bảo vệ thứ bạn không biết mình có"

📖 Định nghĩa

Metadata"dữ liệu mô tả dữ liệu". Nó không phải nội dung, mà là thông tin về nội dung đó.

Ba loại metadata thường gặp:

  • Metadata nghiệp vụ (business): ý nghĩa, định nghĩa, ai sở hữu. VD: "cột so_du là số dư khả dụng, đơn vị VND".
  • Metadata kỹ thuật (technical): kiểu dữ liệu, tên bảng, nơi lưu. VD: bảng KHACH_HANG, cột SDT kiểu chuỗi 10 ký tự.
  • Metadata vận hành (operational): ai tạo/sửa, khi nào, tần suất cập nhật, được sao lưu chưa.

Khi tổ chức metadata vào một nơi tra cứu được, ta có Data Catalog — như "mục lục thư viện" của toàn bộ dữ liệu. Nhiều catalog hiện đại còn ghi cả data lineage (đường đi dữ liệu, mục Data mapping & ROPA) và nhãn nhạy cảm.

💡 Ví dụ ngân hàng

Khi bạn cần làm data mapping cho quy trình "mở thẻ", thay vì đi hỏi từng phòng "dữ liệu này nằm đâu", một Data Catalog tốt cho bạn tra ngay: trường ảnh CCCD nằm ở kho ảnh nào, được gắn nhãn nhạy cảm, owner là phòng nào. Metadata tiết kiệm cho privacy hàng chục giờ phỏng vấn.

7. Master Data & Reference Data ↑ đầu trang

⏱ ~12 phút · Dữ liệu "lõi" dùng chung toàn ngân hàng

Master Data (dữ liệu chủ)

Dữ liệu lõi về các thực thể quan trọng, ít thay đổi, dùng chung nhiều nơi: khách hàng, sản phẩm, nhân viên, tài khoản.

VD: hồ sơ định danh khách hàng (CIF) — mọi hệ thống đều tham chiếu.

Reference Data (dữ liệu tham chiếu)

Các danh mục/bảng mã chuẩn để phân loại: mã tỉnh/thành, mã quốc gia, loại tiền tệ, mã ngành nghề.

VD: "VND", "USD"; "Hà Nội = 01".

Master Data Management (MDM) là việc giữ cho dữ liệu chủ duy nhất, nhất quán — tránh tình trạng một khách hàng có nhiều hồ sơ rời rạc ở các hệ thống khác nhau (gọi là "golden record" — bản ghi vàng duy nhất).

⚠️ Lưu ý privacy

Master data về khách hàng chính là tâm điểm dữ liệu cá nhân. Nếu một người có 3 hồ sơ trùng, khi họ yêu cầu "xóa dữ liệu của tôi" (xem mục Quyền của chủ thể dữ liệu), bạn có nguy cơ xóa sót. MDM tốt giúp privacy thực thi quyền của chủ thể dữ liệu chính xác.

8. Con người & vai trò ↑ đầu trang

⏱ ~12 phút · Hỏi đúng người — ai chịu trách nhiệm gì về dữ liệu

Khi đi hỏi thông tin để làm data mapping, bạn cần biết hỏi đúng người. Đây là các vai trò chuẩn:

Vai tròLà ai / làm gìTrả lời được câu hỏi gì
Data Owner
Chủ sở hữu dữ liệu
Thường là lãnh đạo nghiệp vụ (vd Trưởng phòng Thẻ). Chịu trách nhiệm cuối cùng về một tập dữ liệu.Mục đích sử dụng? Ai được phép dùng? Lưu bao lâu?
Data Steward
Người quản lý nghiệp vụ dữ liệu
Người am hiểu nghiệp vụ, định nghĩa ý nghĩa từng trường dữ liệu, đảm bảo chất lượng.Trường này nghĩa là gì? Lấy từ đâu? Đúng/đủ không?
Data Custodian
Người trông giữ kỹ thuật
Thường là IT/DBA — vận hành, lưu trữ, sao lưu, phân quyền trên hệ thống.Lưu ở server/cloud nào? Mã hóa chưa? Ai có quyền truy cập?
DPO / Cán bộ Privacy
(chính là bạn)
Đảm bảo tuân thủ pháp luật bảo vệ dữ liệu cá nhân; lập & duy trì ROPA, đánh giá rủi ro.Có căn cứ pháp lý chưa? Có cần đánh giá tác động không?
⚠️ Ranh giới Business vs IT

Business biết tại sao dùng dữ liệu và nghĩa của nó. IT biết dữ liệu nằm ở đâuđược bảo vệ thế nào. Một data mapping tốt cần ghép cả hai — đó là lý do bạn phải nói chuyện với cả Steward (business) lẫn Custodian (IT).

✎ Bài tập Module 1
  1. Xếp các ví dụ sau vào đúng bậc DIKW: (a) "0987-***-321"; (b) "Số điện thoại của KH A"; (c) "KH A thường đổi số mỗi khi đổi việc".
  2. Kể tên 3 lĩnh vực trong DAMA Wheel liên quan nhất tới công việc privacy và giải thích vì sao.
  3. Một khách hàng có 2 hồ sơ (CIF) trùng trong hệ thống. Đây là lỗi của chiều chất lượng dữ liệu nào? Nó gây rủi ro gì cho quyền "được xóa" của khách hàng?
  4. Trong quy trình mở thẻ, hãy chỉ ra ai là Data Owner, ai là Data Steward, ai là Data Custodian (theo hiểu biết của bạn về ngân hàng).

→ Xem gợi ý đáp án ở mục Đáp án bài tập.

📝 Trắc nghiệm Module 1 10 câu · cần đúng ≥ 7 để ĐẠT

Module 2 ~3 giờ

Hiểu thế giới IT

Học đủ "tiếng IT" để hiểu vì sao họ hỏi bạn những câu kỹ thuật — và trả lời được. Server, database, cloud, tích hợp, bảo mật, an ninh mạng.

9. Hạ tầng cơ bản: server, database, app, API ↑ đầu trang

⏱ ~12 phút · Những "viên gạch" IT để hiểu khi họ mô tả nơi dữ liệu chạy

Để hiểu IT nói gì, bạn cần vài "viên gạch" nền. Dùng ẩn dụ cho dễ nhớ:

Thuật ngữ ITHiểu nôm naẨn dụ đời thường
Server (máy chủ)Một máy tính mạnh chạy liên tục để phục vụ nhiều người, lưu & xử lý dữ liệu.Cái nhà kho trung tâm luôn mở cửa phục vụ.
Database (cơ sở dữ liệu, DB)Nơi chứa dữ liệu có tổ chức, tìm kiếm nhanh.Hệ thống kệ hồ sơ có đánh số trong kho.
Application (ứng dụng, app)Phần mềm người dùng bấm vào (app mobile, web nội bộ).Quầy giao dịch bạn nói chuyện.
API"Cửa" tiêu chuẩn để hai hệ thống trao đổi dữ liệu tự động.Ô cửa giao nhận hàng giữa hai kho.
On-premise (tại chỗ)Server đặt trong data center do ngân hàng tự quản.Kho của chính mình, trong khuôn viên.
Data center (trung tâm dữ liệu)Tòa nhà chứa nhiều server, có điện, làm mát, bảo vệ.Khu kho bãi chuyên dụng.
🔍 Tại sao IT hỏi

Khi IT nói "dữ liệu này từ app gọi API sang core banking rồi ghi vào DB" — họ đang mô tả đường đi của dữ liệu. Hiểu các viên gạch này, bạn sẽ vẽ được data flow (mục Data flow) thay vì gật gù cho qua.

10. Cơ sở dữ liệu đi sâu một chút ↑ đầu trang

⏱ ~15 phút · Nơi phần lớn dữ liệu cá nhân thực sự nằm

Phần lớn dữ liệu cá nhân có cấu trúc nằm trong cơ sở dữ liệu (database, DB). Hiểu cấu trúc cơ bản giúp bạn "đọc" được khi IT mô tả nơi lưu dữ liệu.

Bảng, hàng, cột, khóa

Khái niệmNghĩaẨn dụ "bảng Excel"
Table (bảng)Một tập dữ liệu cùng loạiMột sheet "Khách hàng"
Row / Record (hàng/bản ghi)Một đối tượng cụ thểMột dòng = một khách hàng
Column / Field (cột/trường)Một thuộc tínhCột "Họ tên", "SĐT"
Primary Key (khóa chính)Mã định danh duy nhất mỗi hàngCột "Mã KH" không trùng
Foreign Key (khóa ngoại)Liên kết sang bảng khác"Mã KH" ở bảng Giao dịch trỏ về bảng Khách hàng

SQL và NoSQL

SQL / Quan hệ (relational)

Dữ liệu chia thành các bảng có quan hệ, truy vấn bằng ngôn ngữ SQL. Phù hợp dữ liệu có cấu trúc rõ (tài khoản, giao dịch).

VD: Oracle, SQL Server, PostgreSQL, MySQL.

NoSQL / Phi quan hệ

Linh hoạt hơn, lưu dạng tài liệu, khóa-giá trị, cột rộng (wide-column) hoặc đồ thị. Phù hợp dữ liệu đa dạng, quy mô lớn (log, hồ sơ JSON).

VD: MongoDB (tài liệu), Cassandra (cột rộng), Redis (khóa-giá trị).

💡 Ví dụ ngân hàng — "Core Banking" là gì?

Khi IT nói "dữ liệu nằm trong core", họ nói đến hệ thống lõi ngân hàng (Core Banking) — phần mềm trung tâm quản lý tài khoản, tiền gửi, khoản vay. Đây là "két sắt dữ liệu" quan trọng nhất, thường là database quan hệ lớn. Ngoài core còn có CRM (quản lý khách hàng), LOS (khởi tạo khoản vay), kho dữ liệu (data warehouse)...

🔍 Tại sao IT hỏi

Khi IT hỏi "chị cần ở mức bảng hay cột nào?" — họ muốn khoanh vùng chính xác trường dữ liệu để phân quyền. Privacy nên trả lời đến mức cột/trường (vd chỉ cần cột "tên" + "số thẻ đã mask"), thay vì xin nguyên cả bảng — đúng tinh thần tối thiểu hóa.

11. SQL — ngôn ngữ "nói chuyện" với dữ liệu ↑ đầu trang

⏱ ~25 phút · Kỹ năng nền tảng số 1 của bất kỳ ai làm data — kể cả DPO

"Giới thiệu về data mà không có SQL thì... giỡn à." — Một sự thật của ngành. SQL là kỹ năng được yêu cầu nhiều nhất trong các tin tuyển dụng liên quan dữ liệu suốt nhiều năm.

11.1 SQL là gì?

📖 Định nghĩa

SQL (Structured Query Language — đọc là "ét-cu-eo" hoặc "si-cừu") là ngôn ngữ tiêu chuẩn để hỏi–đáp và thao tác với cơ sở dữ liệu quan hệ. Bạn "đặt câu hỏi" bằng SQL, database trả lời bằng một bảng kết quả.

Hãy nhớ lại mục Cơ sở dữ liệu: dữ liệu nằm trong các bảng (hàng × cột). SQL chính là cách bạn lấy đúng phần dữ liệu mình cần ra khỏi các bảng đó — thay vì mở cả triệu dòng bằng mắt.

💡 Ví dụ trực giác

Tưởng tượng database là một thủ thư. SQL là câu bạn nói với thủ thư: "Cho tôi họ tên của những khách hàng mở thẻ trong tháng này, sắp theo ngày mở." Thủ thư (database) chạy đi và đem về đúng danh sách đó.

11.2 Vì sao làm data — và làm Privacy — lại CẦN biết SQL?

Vì saoCụ thể với người làm Privacy/DPO
Tự trả lời câu hỏi, không phải chờ ITCần biết "có bao nhiêu khách hàng còn lưu CCCD quá 5 năm?" → tự query thay vì gửi yêu cầu chờ 2 tuần.
Hiểu dữ liệu thực sự có gìPhục vụ data inventory & data mapping: biết bảng nào có trường cá nhân nào.
Thực thi quyền chủ thể (DSAR)Tìm mọi bản ghi của một khách hàng để cung cấp/xóa (xem mục Quyền của chủ thể dữ liệu).
Kiểm tra tuân thủ & auditĐếm bản ghi quá hạn lưu, dò dữ liệu nhạy cảm để trống căn cứ pháp lý.
Nói cùng ngôn ngữ với IT & data teamĐọc hiểu query người khác viết, biết một báo cáo lấy dữ liệu từ đâu.
🔑 Ghi nhớ

DPO không cần trở thành lập trình viên database. Nhưng biết đọc một câu SQL và viết được các truy vấn SELECT cơ bản là khác biệt giữa một DPO "bị dắt mũi" và một DPO chủ động kiểm chứng được tình trạng dữ liệu.

11.3 6 mảnh ghép SQL cốt lõi (đọc là hiểu)

Một câu truy vấn lấy dữ liệu (SELECT) gần như luôn ghép từ các "mảnh" sau. Ví dụ trên bảng giả KHACH_HANG:

Từ khóaNghĩa ("dịch" sang tiếng Việt)
SELECT"Lấy ra (những cột)…"
FROM"…từ bảng nào"
WHERE"…với điều kiện lọc gì"
ORDER BY"…sắp xếp theo"
GROUP BY + COUNT()"…gom nhóm & đếm"
JOIN"…ghép thêm dữ liệu từ bảng khác"

Ví dụ 1 — Truy vấn cơ bản

SELECT  ho_ten, ngay_mo_the
FROM    KHACH_HANG
WHERE   thang_mo = 6
ORDER BY ngay_mo_the;

👉 "Lấy họ tênngày mở thẻ từ bảng KHACH_HANG, chỉ những ai mở thẻ tháng 6, sắp theo ngày." Dễ như đọc tiếng Anh đúng không?

Ví dụ 2 — Đếm theo nhóm (rất hợp cho audit)

SELECT  loai_du_lieu, COUNT(*) AS so_ban_ghi
FROM    KHO_DU_LIEU_CA_NHAN
WHERE   ngay_thu_thap < '2020-01-01'
GROUP BY loai_du_lieu;

👉 "Đếm xem mỗi loại dữ liệu có bao nhiêu bản ghi thu thập trước 2020." → Câu hỏi audit kinh điển: "dữ liệu nào đang lưu quá lâu?"

Ví dụ 3 — Ghép 2 bảng bằng JOIN

Dữ liệu thường nằm ở nhiều bảng. JOIN ghép chúng lại qua khóa chung (xem khóa chính/khóa ngoại ở mục Database):

SELECT  kh.ho_ten, gd.so_tien, gd.ngay_gd
FROM    KHACH_HANG  kh
JOIN    GIAO_DICH   gd  ON gd.ma_kh = kh.ma_kh
WHERE   gd.ngay_gd >= '2026-01-01';

👉 "Lấy họ tên (từ bảng Khách hàng) cùng số tiền, ngày (từ bảng Giao dịch), ghép hai bảng qua mã KH chung, chỉ giao dịch từ đầu 2026." → JOIN chính là cách bạn lần theo dữ liệu của một người trải khắp nhiều bảng — kỹ năng cốt lõi khi xử lý DSAR (xem mục Quyền của chủ thể dữ liệu).

⚠️ Lưu ý privacy & an toàn KHI dùng SQL
  • Quyền truy cập: DPO thường chỉ nên có quyền đọc (read-only) trên môi trường phù hợp — và bản thân việc bạn truy cập dữ liệu cá nhân cũng phải có căn cứ & được log lại.
  • Tối thiểu hóa: chỉ SELECT đúng cột cần, đừng SELECT * (lấy tất cả) khi không cần — đúng tinh thần nguyên tắc tối thiểu hóa.
  • Cẩn trọng: các lệnh UPDATE, DELETE, DROP thay đổi/xóa dữ liệu — DPO hầu như không bao giờ chạy chúng trên dữ liệu thật. Hiểu để biết, không để nghịch.
  • Môi trường: tập luyện trên dữ liệu giả/được ẩn danh, không thực hành trên dữ liệu khách hàng thật.

11.4 Học SQL như thế nào? (lộ trình 4 tuần cho người mới)

TuầnMục tiêuNắm được gì
Tuần 1Đọc hiểu truy vấnSELECT … FROM … WHERE … ORDER BY. Đọc được query người khác viết.
Tuần 2Lọc & tính toánToán tử (=, >, LIKE, IN, BETWEEN), AND/OR, hàm COUNT/SUM/AVG.
Tuần 3Gom nhóm & ghép bảngGROUP BY, HAVING, và JOIN (ghép bảng Khách hàng với Giao dịch).
Tuần 4Áp dụng vào privacyViết query phục vụ inventory, đếm dữ liệu quá hạn, tìm bản ghi cho DSAR.
❓ FAQ — Học ở đâu & cần lưu ý gì

Tài nguyên gợi ý (loại): các nền tảng học SQL tương tác miễn phí/giá rẻ (vd kiểu "SQL practice" tương tác), khóa SQL trên các nền tảng học trực tuyến, và quan trọng nhất là thực hành trên một database mẫu.

Mẹo của trainer: đừng học thuộc lý thuyết — hãy lấy một câu hỏi nghiệp vụ thật ("có bao nhiêu KH chưa cập nhật CCCD?") và tự viết query trả lời. Học qua bài toán thật nhanh hơn gấp 5 lần.

Lưu ý ngân hàng: luôn dùng dữ liệu mẫu/giả để luyện; xin quyền read-only trên môi trường phù hợp; tuyệt đối không chạy thử lệnh thay đổi dữ liệu trên hệ thống thật.

✎ Thử ngay — "dịch" câu SQL này sang tiếng Việt
SELECT ho_ten, so_dien_thoai
FROM   KHACH_HANG
WHERE  da_dong_y_marketing = 'KHONG';
Xem đáp án

"Lấy họ tênsố điện thoại của những khách hàng KHÔNG đồng ý nhận marketing." → Chính là danh sách bạn phải loại khỏi chiến dịch quảng cáo để không vi phạm. Thấy chưa — SQL là công cụ privacy thực thụ!

12. Cloud & nơi dữ liệu "ở" ↑ đầu trang

⏱ ~15 phút · Cloud là gì, tên nhà cung cấp & vì sao "region" quan trọng với privacy

Cloud (điện toán đám mây) đơn giản là thuê server/hạ tầng của nhà cung cấp (AWS, Google, Microsoft...) qua internet, thay vì tự mua máy. Khác với thuê chỗ đặt máy truyền thống, cloud có 3 đặc trưng cốt lõi: tự phục vụ tức thì (bật/tắt tài nguyên ngay), co giãn (scale lên/xuống theo nhu cầu) và trả theo mức dùng (pay-as-you-go). Có 3 "mức thuê":

Mô hìnhBạn thuê gìẨn dụ
IaaS (Infrastructure)Thuê "máy trống", tự cài mọi thứ.Thuê mặt bằng trống.
PaaS (Platform)Thuê nền có sẵn để chạy phần mềm.Thuê bếp đã trang bị.
SaaS (Software)Dùng luôn phần mềm trọn gói (vd Microsoft 365, Salesforce).Ăn nhà hàng, không cần nấu.

Public / Private / Hybrid cloud

  • Public cloud: dùng chung hạ tầng của nhà cung cấp lớn (nhiều khách hàng cùng dùng, được cô lập logic).
  • Private cloud: hạ tầng riêng cho một tổ chức (kiểm soát cao hơn, hay dùng cho dữ liệu nhạy cảm).
  • Hybrid: kết hợp cả hai — rất phổ biến ở ngân hàng VN: dữ liệu nhạy cảm/core giữ on-premise hoặc private/cloud nội địa, phần ít nhạy cảm đưa lên public cloud.

Các nhà cung cấp cloud — quốc tế & Việt Nam

Bạn nên thuộc tên những "ông lớn" này, vì khi làm data mapping bạn sẽ phải ghi rõ dữ liệu đang chạy trên cloud của ai, đặt ở đâu.

NhómNhà cung cấpGhi chú cho privacy
Quốc tế AWS (Amazon Web Services), Microsoft Azure, Google Cloud (GCP)"hyperscaler" toàn cầu Ba "ông lớn" toàn cầu. Có data center ở nhiều quốc gia → cần xác định region đang dùng (Singapore? Mỹ?) để xét cross-border.
Oracle Cloud (OCI), IBM Cloud Phổ biến trong khối doanh nghiệp/ngân hàng dùng hệ thống Oracle, IBM.
Alibaba Cloud, Huawei Cloud, Tencent Cloud Các nhà cung cấp châu Á, có hiện diện khu vực Đông Nam Á.
Việt Nam
(cloud nội địa)
Viettel Cloud (Viettel IDC), VNPT Cloud, FPT Cloud (FPT Smart Cloud), CMC Cloud (CMC Telecom) Bốn nhà cung cấp cloud nội địa lớn nhất. Data center đặt tại Việt Nam → thuận lợi cho yêu cầu lưu trữ dữ liệu trong nước.
VNG Cloud, Bizfly Cloud (VCCorp), MobiFone Cloud, Long Vân, ODS Các nhà cung cấp nội địa khác. Lựa chọn khi cần dữ liệu nằm trong lãnh thổ VN.
🏦 Vì sao ngân hàng VN quan tâm cloud nội địa

Pháp luật về an ninh mạng và bảo vệ dữ liệu cá nhân của Việt Nam đặt ra yêu cầu về lưu trữ dữ liệu trong nước (data localization) đối với một số loại dữ liệu, và Ngân hàng Nhà nước (SBV/NHNN) có quy định riêng về an toàn hệ thống thông tin ngân hàng. Vì vậy nhiều ngân hàng chọn cloud nội địa (Viettel, VNPT, FPT, CMC...) hoặc on-premise cho dữ liệu nhạy cảm, chỉ đưa phần ít nhạy cảm lên public cloud quốc tế. (Yêu cầu cụ thể cần tra cứu văn bản hiện hành — xem mục Khung pháp lý Việt Nam.)

🔍 Tại sao IT hỏi / bạn nên hỏi IT

Câu hỏi vàng bạn cần đặt cho mỗi hệ thống: "Hệ thống này chạy on-premise hay cloud? Nếu cloud thì của nhà cung cấp nào, region/quốc gia nào?" — Câu trả lời quyết định trực tiếp việc có phát sinh chuyển dữ liệu xuyên biên giới hay không (xem các mục Data mapping & ROPA & Khung pháp lý Việt Nam).

⚠️ Lưu ý privacy: Data residency / Region

Data residency = dữ liệu thực sự nằm ở quốc gia nào. Cloud có nhiều "region" (vùng) ở các nước khác nhau. Nếu dữ liệu cá nhân của khách hàng Việt Nam được lưu ở region nước ngoài → đó là chuyển dữ liệu xuyên biên giới (cross-border transfer), cần hồ sơ tuân thủ theo pháp luật VN (xem mục Data mapping & ROPA). Đây là lý do bạn phải hỏi IT: "Cái này lưu ở region nào?"

Mô hình trách nhiệm chung (shared responsibility)

Trên cloud, bảo mật được chia đôi: nhà cung cấp lo an toàn của hạ tầng ("security of the cloud"), còn ngân hàng lo cấu hình & dữ liệu của mình ("security in the cloud"). Dữ liệu khách hàng luôn là trách nhiệm của ngân hàng — không phải của nhà cung cấp cloud.

13. Tích hợp dữ liệu: ETL, API, batch & real-time ↑ đầu trang

⏱ ~12 phút · Dữ liệu di chuyển giữa các hệ thống bằng cách nào

Dữ liệu hiếm khi nằm yên một chỗ — nó liên tục được chuyển giữa các hệ thống. Hiểu cách di chuyển giúp bạn vẽ data flow (mục Data flow) chính xác.

Cách tích hợpNghĩaVí dụ
ETL (Extract–Transform–Load)Rút dữ liệu ra → biến đổi → nạp vào nơi khác (thường để báo cáo).Gom giao dịch hằng đêm vào kho dữ liệu (data warehouse).
ELTNhư ETL nhưng nạp trước rồi mới biến đổi (phổ biến trên cloud).Đổ dữ liệu thô lên cloud rồi xử lý sau.
API"Cửa" để hai hệ thống hỏi–đáp dữ liệu theo thời gian thực.App mobile gọi API kiểm tra số dư.
Batch (theo lô)Xử lý gom theo đợt định kỳ.Cuối ngày tổng hợp giao dịch.
Real-time / StreamingXử lý ngay khi dữ liệu phát sinh.Cảnh báo gian lận tức thì khi quẹt thẻ.
⚠️ Lưu ý privacy

Mỗi điểm tích hợp là một điểm dữ liệu rời khỏi nơi gốc → là chỗ rủi ro privacy. Khi làm mapping, hãy hỏi: "Dữ liệu này được sao chép sang đâu qua ETL/API? Bản sao đó được bảo vệ & xóa thế nào?" Rất nhiều rò rỉ xảy ra ở các bản sao "tạm" mà không ai để ý.

🔍 Tại sao IT hỏi

Khi IT nói "cái này chạy batch hằng đêm hay real-time qua API?" — họ đang xác định dữ liệu được nhân bản lúc nào, ở đâu. Với privacy, real-time API thường để lại ít bản sao hơn batch (vốn tạo ra nhiều file trung gian) — tuy nhiên hệ thống streaming/hàng đợi sự kiện (vd Kafka) cũng có thể lưu lại dữ liệu khá lâu, nên vẫn phải hỏi rõ.

14. IT Security cơ bản ↑ đầu trang

⏱ ~15 phút · CIA, mã hóa, phân quyền, ẩn danh/giả danh/masking

CIA Triad — ba trụ cột an ninh thông tin

C — Confidentiality (Bảo mật)

Chỉ người được phép mới xem được dữ liệu.

I — Integrity (Toàn vẹn)

Dữ liệu không bị sửa đổi sai trái, luôn chính xác.

A — Availability (Sẵn sàng)

Dữ liệu/hệ thống luôn truy cập được khi cần.

Các kỹ thuật bảo vệ bạn sẽ nghe IT nhắc

Thuật ngữHiểu nôm naLiên quan privacy
Encryption at rest
(mã hóa khi lưu)
Dữ liệu trong kho được khóa mã, mất file cũng không đọc được.Bảo vệ dữ liệu cá nhân khi bị rò rỉ ổ đĩa/backup.
Encryption in transit
(mã hóa khi truyền)
Dữ liệu được khóa khi chạy qua đường mạng (HTTPS/TLS).Chống nghe lén khi dữ liệu di chuyển.
Access control / RBACPhân quyền theo vai trò — ai làm việc gì thì thấy đúng dữ liệu đó.Giới hạn người tiếp xúc dữ liệu cá nhân.
Least privilege
(quyền tối thiểu)
Cho mỗi người đúng mức quyền cần thiết, không hơn.Giảm rủi ro lạm dụng dữ liệu.
Segregation of dutiesTách việc để không ai một mình làm trọn quy trình nhạy cảm.Chống gian lận nội bộ.
Audit log / trail
(nhật ký truy cập)
Ghi lại ai đã xem/sửa dữ liệu, khi nào.Truy vết khi có sự cố, chứng minh tuân thủ.
Backup & retentionSao lưu dự phòng & quy định giữ bao lâu.Backup cũng chứa dữ liệu cá nhân → phải xóa đúng hạn.

Ba "anh em" hay bị nhầm: Anonymization / Pseudonymization / Masking

Rất quan trọng với privacy — chúng quyết định dữ liệu còn là "dữ liệu cá nhân" hay không:

Kỹ thuậtLàm gìCòn truy ngược ra người được không?
Anonymization
(ẩn danh)
Xóa/biến đổi để không thể nhận lại danh tính, kể cả có dữ liệu phụ.Không (nếu làm đúng) → thường thoát phạm vi dữ liệu cá nhân.
Pseudonymization
(giả danh)
Thay danh tính bằng mã (token), nhưng có "chìa khóa" để ghép lại.Có (nếu có chìa khóa) → vẫn là dữ liệu cá nhân.
Masking
(che hiển thị)
Che một phần khi hiển thị, vd 0123-***-789.Tùy mức che; dữ liệu gốc thường vẫn còn ở dưới.
🔍 Tại sao IT hỏi

Khi IT hỏi "chỗ này chị cần dữ liệu thật hay đã mask/ẩn danh là đủ?" — họ đang giúp bạn giảm rủi ro. Nếu báo cáo chỉ cần thống kê, dùng dữ liệu ẩn danh sẽ đưa nó ra ngoài phạm vi nhiều nghĩa vụ privacy. Trả lời đúng câu này giúp tiết kiệm rất nhiều công tuân thủ.

15. An ninh mạng & các mối đe dọa ↑ đầu trang

⏱ ~15 phút · Hiểu kẻ tấn công nghĩ gì để bảo vệ dữ liệu cá nhân

Privacy và an ninh mạng (cybersecurity) là hai mặt của một đồng xu: rò rỉ dữ liệu cá nhân thường bắt nguồn từ một sự cố an ninh. Đây là những "tấm khiên" và "mũi tên" bạn nên biết.

Lá chắn phòng thủ phổ biến

Biện phápNghĩa nôm na
Firewall (tường lửa)"Bảo vệ cổng" lọc lưu lượng mạng ra/vào, chặn truy cập trái phép.
VPN"Đường hầm" mã hóa để truy cập hệ thống nội bộ an toàn từ xa.
MFA / 2FA (xác thực đa yếu tố)Cần thêm yếu tố thứ hai (OTP, vân tay) ngoài mật khẩu.
IDS/IPSHệ thống phát hiện/ngăn chặn xâm nhập, "camera + còi báo động".
DLP (Data Loss Prevention)Ngăn dữ liệu nhạy cảm bị gửi ra ngoài (vd chặn email kèm file chứa CCCD).
SIEMHệ thống gom & phân tích nhật ký để phát hiện bất thường.

Các mối đe dọa hay gặp

Mối đe dọaLà gìRủi ro với dữ liệu cá nhân
Phishing (lừa đảo)Giả mạo email/tin nhắn để lừa lấy thông tin đăng nhập.Kẻ gian chiếm tài khoản nhân viên → truy cập dữ liệu KH.
Malware / RansomwareMã độc; ransomware mã hóa dữ liệu đòi tiền chuộc.Mất quyền truy cập + nguy cơ lộ dữ liệu KH.
Insider threat (nội bộ)Nhân viên cố ý/vô ý làm lộ dữ liệu.Tải trộm danh sách KH; gửi nhầm file.
Social engineeringThao túng tâm lý để moi thông tin.Giả danh KH gọi tổng đài lấy thông tin người khác.
Data breach (lộ lọt dữ liệu)Sự cố khiến dữ liệu bị truy cập/tiết lộ trái phép.Chính là sự kiện privacy phải xử lý (xem mục Sự cố lộ lọt dữ liệu).
🔑 Ghi nhớ

Bạn không cần trở thành chuyên gia bảo mật. Nhưng hiểu các khái niệm này giúp bạn (1) phối hợp với đội an ninh khi có sự cố, (2) đánh giá xem một hệ thống đã có biện pháp bảo vệ dữ liệu cá nhân "phù hợp" chưa — đây là yêu cầu của pháp luật.

16. ITGC & ITAC — các "chốt kiểm soát" CNTT ↑ đầu trang

⏱ ~18 phút · Ngôn ngữ kiểm soát mà DPO dùng để "drive" system owner

Trong thực tế, DPO hiếm khi tự tay cấu hình hệ thống. Thay vào đó, DPO yêu cầu & thúc đẩy (drive) chủ sở hữu hệ thống (system owner) triển khai các chốt kiểm soát bảo vệ dữ liệu. Muốn drive được, bạn phải nói đúng "ngôn ngữ kiểm soát": ITGC & ITAC.

16.1 ITGC — IT General Controls (Kiểm soát chung CNTT)

📖 Định nghĩa

ITGC là các kiểm soát nền áp dụng cho toàn bộ môi trường CNTT — mọi ứng dụng đều "đứng" trên chúng. Nếu ITGC yếu, thì kiểm soát trong từng ứng dụng (ITAC) cũng mất ý nghĩa.

Nhóm ITGCKiểm soát gìVí dụ ngân hàng (liên quan privacy)
Quản lý truy cập (Access Mgmt)Ai được vào hệ thống, quyền gì; cấp/thu hồi quyềnRBAC, rà soát quyền định kỳ, thu hồi quyền khi nghỉ việc → giới hạn người chạm dữ liệu cá nhân
Quản lý thay đổi (Change Mgmt)Mọi thay đổi hệ thống phải được kiểm thử & phê duyệtCập nhật app eKYC phải qua kiểm thử & duyệt trước khi lên production
Vận hành CNTT (IT Operations)Sao lưu, lập lịch tác vụ, giám sát, xử lý sự cốBackup dữ liệu KH được mã hóa & kiểm tra phục hồi định kỳ
Bảo mật vận hành (Security Ops)Vá lỗi, chống mã độc, quản lý nhật kýAudit log truy cập dữ liệu nhạy cảm được lưu & rà soát
SDLC (vòng đời phát triển)Phát triển phần mềm an toàn, tách môi trườngKhông dùng dữ liệu KH thật ở môi trường test (privacy by design)

16.2 ITAC — IT Application Controls (Kiểm soát ứng dụng)

📖 Định nghĩa

ITAC là các kiểm soát bên trong một ứng dụng cụ thể, đảm bảo dữ liệu/giao dịch đầy đủ, chính xác, hợp lệ & được phép — gắn với 3 điểm: đầu vào (input) → xử lý (processing) → đầu ra (output).

Loại ITACMục tiêuVí dụ
Kiểm soát đầu vàoDữ liệu nhập đúng định dạng, hợp lệKiểm tra CCCD đủ 12 số; bắt buộc nhập trường; chống nhập trùng
Kiểm soát xử lýTính toán/biến đổi đúng, không mất dữ liệuĐối chiếu (reconciliation) tổng số bản ghi vào = ra
Kiểm soát đầu raKết quả đến đúng người, đúng định dạngSao kê chỉ gửi đúng chủ tài khoản; masking số thẻ khi hiển thị
Phân quyền & phê duyệtGiao dịch nhạy cảm cần phê duyệtXuất danh sách KH phải có cấp duyệt; tách quyền (maker–checker)
💡 ITGC vs ITAC — phân biệt nhanh

ITGC = "luật chung của cả tòa nhà" (điện, khóa cửa, camera). ITAC = "quy tắc trong từng căn phòng" (phòng này ai vào làm gì). Kiểm toán CNTT luôn kiểm ITGC trước — vì ITAC chỉ đáng tin khi ITGC vững.

🔑 DPO "drive" system owner thế nào

DPO không cài đặt, nhưng biến nghĩa vụ privacy thành yêu cầu kiểm soát cụ thể và giao cho system owner (vai R trong RACI): "Hệ thống X xử lý dữ liệu nhạy cảm → cần ITGC: rà soát quyền hằng quý, log truy cập 12 tháng; cần ITAC: masking số thẻ khi hiển thị, maker–checker khi xuất dữ liệu." Sau đó DPO theo dõi bằng chứng (evidence) việc đã triển khai — đúng tinh thần accountability.

17. ISO/IEC 27001 & các chuẩn liên quan ↑ đầu trang

⏱ ~18 phút · "Bộ khung" để chuẩn hóa các chốt kiểm soát ở trên

ITGC/ITAC trả lời "kiểm soát gì". ISO/IEC 27001 trả lời "làm sao quản trị các kiểm soát đó một cách có hệ thống & chứng minh được". Đây là chuẩn quốc tế mà DPO hay viện dẫn để yêu cầu hệ thống & nhà cung cấp.

📖 ISO/IEC 27001 là gì

Là chuẩn quốc tế về Hệ thống quản lý an toàn thông tin (ISMS — Information Security Management System): tiếp cận theo rủi ro, yêu cầu tổ chức nhận diện rủi ro, chọn & áp dụng biện pháp kiểm soát (Annex A controls), rồi vận hành theo nguyên tắc cải tiến liên tục (tinh thần PDCA — Plan–Do–Check–Act; bản 27001:2022 không còn bắt buộc mô hình PDCA tường minh). Tổ chức có thể được chứng nhận (certified) bởi bên thứ ba theo một phạm vi (scope) khai trong Statement of Applicability (SoA).

17.1 "Họ" tiêu chuẩn ISO 27000 & chuẩn liên quan

ChuẩnVề gìLiên quan DPO/privacy
ISO/IEC 27001Yêu cầu ISMS (chứng nhận được)Khung tổng cho an toàn thông tin — nền cho bảo vệ DLCN
ISO/IEC 27002Hướng dẫn chi tiết từng biện pháp kiểm soát"Cẩm nang" cách làm các control (gồm nhiều ITGC/ITAC)
ISO/IEC 27701Mở rộng quản lý thông tin riêng tư (PIMS) trên nền 27001★ Chuẩn "privacy" — ánh xạ tốt sang GDPR & nghĩa vụ bảo vệ DLCN
ISO/IEC 27017 / 27018An toàn cho dịch vụ cloud / bảo vệ PII trên cloudDùng khi đánh giá nhà cung cấp cloud (xem Bên thứ ba)
PCI DSSAn toàn dữ liệu thẻ thanh toánBắt buộc với hệ thống xử lý dữ liệu thẻ ở ngân hàng
NIST CSFKhung an ninh mạng (Mỹ)Tham chiếu để phân loại & quản lý rủi ro an ninh mạng
COBITKhung quản trị CNTT (ISACA)Mạnh về governance & ITGC; hay dùng trong kiểm toán CNTT
SOC 1 (ISAE 3402) / SOC 2Báo cáo kiểm toán độc lập về kiểm soát của bên cung cấp dịch vụ★ Bằng chứng cho ITAC/kiểm soát giao dịch (SOC 1) & an toàn vận hành (SOC 2) — bổ sung cho ISO
💡 Ghép mảnh: ITGC/ITAC ↔ ISO 27001 ↔ Privacy

Hình dung như xây nhà: ISO 27001/27701bản quy chuẩn xây dựng (làm có hệ thống, chứng minh được) → trong đó có rất nhiều ITGC/ITACcác hạng mục kiểm soát cụ thể → tất cả phục vụ mục tiêu cuối: bảo vệ dữ liệu cá nhân theo luật. DPO đứng ở tầng "yêu cầu & giám sát", IT/system owner đứng ở tầng "triển khai".

🏦 DPO dùng ISO để "drive" trong thực tế
  • Với hệ thống nội bộ: yêu cầu system owner tuân theo chính sách ISMS (ISO 27001) & áp các control Annex A liên quan dữ liệu cá nhân; lấy 27701 làm checklist privacy.
  • Với nhà cung cấp: yêu cầu chứng chỉ ISO 27001 (và 27701/27017/27018 nếu cloud) như điều kiện thẩm định — bằng chứng họ có ITGC tử tế ở cấp tổ chức (gắn với Quản lý bên thứ ba & DPA).
  • ⚠️ Đọc chứng chỉ ISO phải xem KỸ phạm vi (scope/SoA): chứng chỉ chỉ bao trùm đúng dịch vụ/hệ thống đã khai — nhà cung cấp có thể được chứng nhận cho một dịch vụ KHÁC với cái bán cho bạn. Hỏi rõ scope.
  • ITAC ≠ ISO: kiểm soát ứng dụng/giao dịch (ITAC) của một hệ thống cụ thể thường KHÔNG nằm trong scope ISMS chung → đòi thêm báo cáo SOC 1 (ISAE 3402) cho transaction controls, SOC 2 cho an toàn vận hành.
  • Lưu ý: chứng chỉ ISO là bằng chứng tốt nhưng KHÔNG thay thế nghĩa vụ tuân thủ pháp luật VN — vẫn phải đối chiếu PDPL/Nghị định 13 & quy định SBV.
🔑 Ghi nhớ

DPO không cần là chuyên gia ISO 27001. Nhưng biết viện dẫn đúng chuẩn giúp bạn biến yêu cầu privacy mơ hồ thành checklist kiểm soát mà system owner & nhà cung cấp buộc phải làm — và có cơ sở để đo lường, audit.

18. "Giải mã" những câu IT hay hỏi bạn ↑ đầu trang

⏱ ~12 phút · Bảng tra: IT hỏi gì ↔ ý thực sự ↔ bạn chuẩn bị thế nào

Đây là bảng tra cứu thực chiến — khi IT hỏi một câu, họ thực sự muốn biết gì, vì sao nó liên quan privacy, và bạn nên chuẩn bị trả lời thế nào.

IT hay hỏiHọ thực sự muốn biếtVì sao privacy quan tâmBạn nên chuẩn bị
"Data này lưu ở đâu?" Hệ thống/DB/cloud nào, region nào. Xác định cross-border & phạm vi bảo vệ. Tên hệ thống + quốc gia lưu trữ.
"Ai được truy cập?" Danh sách vai trò/người có quyền. Nguyên tắc tối thiểu hóa & quyền tối thiểu. Vai trò nào thật sự cần dùng dữ liệu.
"Có cần dữ liệu thật không?" Mục đích dùng có chấp nhận dữ liệu mask/ẩn danh không. Giảm dữ liệu cá nhân = giảm rủi ro. Mục đích chính xác của việc dùng dữ liệu.
"Giữ bao lâu thì xóa?" Thời hạn lưu trữ (retention). Không giữ quá hạn cần thiết. Căn cứ pháp lý & thời hạn lưu của loại dữ liệu.
"Chia sẻ cho hệ thống/đối tác nào?" Các điểm dữ liệu chảy ra ngoài. Bên thứ ba cần hợp đồng bảo vệ dữ liệu. Danh sách bên nhận + mục đích.
"Phân loại mức nào?" Mức nhạy cảm để áp biện pháp bảo vệ tương ứng. Dữ liệu nhạy cảm cần bảo vệ cao hơn. Nhãn phân loại (xem mục Phân loại dữ liệu).
"Mục đích xử lý là gì?" Lý do nghiệp vụ thu thập/dùng dữ liệu. Nguyên tắc giới hạn mục đích & căn cứ pháp lý. Mô tả mục đích rõ ràng, gắn căn cứ.
💡 Mẹo làm việc

Hãy biến bảng trên thành danh sách câu hỏi của chính bạn khi phỏng vấn các phòng ban. Bạn hỏi đúng 7 câu này cho mỗi quy trình là gần như có đủ nguyên liệu để làm data mapping và ROPA ở mục Data mapping & ROPA.

✎ Bài tập Module 2
  1. Giải thích sự khác nhau giữa "server", "database" và "application" bằng ẩn dụ của riêng bạn.
  2. Một hệ thống chạy trên AWS region Singapore lưu dữ liệu khách hàng VN. Theo bạn, điều này làm phát sinh vấn đề privacy gì?
  3. Kể tên 3 nhà cung cấp cloud nội địa Việt Nam và nêu lý do ngân hàng có thể chọn họ.
  4. Phân biệt "encryption at rest" và "encryption in transit". Một file backup chứa CCCD bị đánh cắp — loại mã hóa nào bảo vệ nó?
  5. Khi nào bạn nên đề nghị IT cung cấp dữ liệu đã mask/ẩn danh thay vì dữ liệu thật?
  6. Hệ thống eKYC xử lý dữ liệu nhạy cảm. Với vai DPO, hãy nêu 2 yêu cầu ITGC2 yêu cầu ITAC bạn giao cho system owner. Và khi thuê nhà cung cấp cloud nước ngoài, bạn viện dẫn chuẩn ISO nào & cần kiểm gì ngoài "có chứng chỉ"?

→ Xem gợi ý đáp án ở mục Đáp án bài tập.

📝 Trắc nghiệm Module 2 10 câu · cần đúng ≥ 7 để ĐẠT

Module 3 ~3 giờ

Privacy thực chiến

Phần "ăn tiền" của khóa học. Từ nguyên tắc & căn cứ pháp lý, đến tự tay làm data flow, inventory, mapping, ROPA, DPIA, xử lý quyền chủ thể và sự cố lộ lọt.

19. Nguyên tắc bảo vệ dữ liệu cá nhân ↑ đầu trang

⏱ ~18 phút · "Kim chỉ nam" cho mọi quyết định privacy

Mọi hoạt động xử lý dữ liệu cá nhân đều phải tuân theo một bộ nguyên tắc. Bộ dưới đây tổng hợp tinh thần chung của pháp luật Việt Nam (Nghị định 13/2023/NĐ-CP) và chuẩn quốc tế (GDPR) — rất giống nhau:

Nguyên tắcNghĩaVi phạm điển hình
1. Hợp pháp, công bằng, minh bạchXử lý phải có căn cứ pháp lý, rõ ràng với chủ thể.Thu thập dữ liệu lén, không thông báo.
2. Giới hạn mục đíchChỉ dùng đúng mục đích đã nêu khi thu thập.Lấy SĐT để xác thực rồi đem đi spam quảng cáo.
3. Tối thiểu hóa dữ liệuChỉ thu thập đúng mức cần thiết.Mở thẻ mà đòi cả hồ sơ y tế.
4. Chính xácGiữ dữ liệu đúng & cập nhật.Lưu địa chỉ cũ khiến gửi nhầm sao kê.
5. Giới hạn lưu trữKhông giữ lâu hơn mức cần thiết.Giữ hồ sơ KH đã đóng tài khoản 20 năm vô căn cứ.
6. Toàn vẹn & bảo mậtBảo vệ bằng biện pháp phù hợp.Lưu CCCD không mã hóa, ai cũng xem được.
7. Trách nhiệm giải trìnhPhải chứng minh được mình tuân thủ.Không có ROPA, không ghi lại sự đồng ý.
🔑 Ghi nhớ

Toàn bộ công cụ ở các bài sau (inventory, mapping, ROPA, DPIA) thực chất chỉ là cách chứng minh bạn đang tuân thủ 7 nguyên tắc này. Khi phân vân, hãy quay về hỏi: "Việc này có vi phạm nguyên tắc nào không?"

Hai khái niệm "kim chỉ nam" đi kèm

Privacy by Design & by Default

Bảo vệ dữ liệu phải được thiết kế vào từ đầu mỗi sản phẩm/quy trình, không phải "vá" về sau; và cấu hình mặc định phải là cấu hình bảo vệ nhất (thu tối thiểu, chia sẻ tối thiểu). Đây là lý do DPO cần tham gia dự án ngay từ khâu ý tưởng.

Accountability & lưu vết (audit trail)

Không chỉ tuân thủ — bạn phải chứng minh được mình tuân thủ: lưu ROPA, hồ sơ DPIA, bằng chứng đã xin/ghi nhận sự đồng ý, nhật ký truy cập (audit log), biên bản đào tạo. "Không ghi lại = chưa làm" dưới góc nhìn của cơ quan quản lý.

20. Căn cứ pháp lý để xử lý dữ liệu ↑ đầu trang

⏱ ~15 phút · "Tôi được phép xử lý dữ liệu này dựa trên cái gì?"

Trước khi xử lý bất kỳ dữ liệu cá nhân nào, phải có căn cứ pháp lý (legal basis). Sự đồng ý được nhắc đến nhiều, nhưng KHÔNG phải là căn cứ "trung tâm" hay cao hơn các căn cứ khác — đây là hiểu lầm tai hại nhất. Pháp luật Việt Nam liệt kê nhiều căn cứ ngang hàng; bạn phải chọn căn cứ phù hợp với từng mục đích:

  • Sự đồng ý (consent): chủ thể tự nguyện đồng ý, rõ ràng, có thể rút lại bất cứ lúc nào.
  • Thực hiện hợp đồng: cần thiết để thực hiện hợp đồng với chính chủ thể (vd xử lý để cấp khoản vay họ yêu cầu).
  • Nghĩa vụ pháp lý: luật yêu cầu (vd định danh KYC, báo cáo phòng chống rửa tiền — AML, lưu trữ theo quy định ngành ngân hàng).
  • Bảo vệ tính mạng/sức khỏe trong trường hợp khẩn cấp.
  • Yêu cầu của cơ quan nhà nước có thẩm quyền theo quy định.
  • Vì lợi ích công cộng, an ninh quốc phòng theo điều kiện luật định.
⚠️ Hai bẫy cực kỳ phổ biến (DPO ngân hàng phải tránh)
  • Lạm dụng "xin đồng ý" sai chỗ: KYC, AML, lưu trữ chứng từ là nghĩa vụ pháp lý — KHÔNG nên (và không cần) xin sự đồng ý cho chúng. Xin đồng ý nhầm chỗ tạo ảo giác khách "có quyền từ chối" trong khi thực ra không.
  • Tưởng Việt Nam giống GDPR: GDPR có căn cứ "lợi ích chính đáng" (legitimate interest) rất rộng — pháp luật Việt Nam không công nhận một căn cứ mở như vậy. Đừng bê nguyên tư duy GDPR; phải ánh xạ mỗi mục đích vào một căn cứ được luật VN cho phép.
📖 Lưu ý pháp luật Việt Nam

Danh mục căn cứ & trường hợp xử lý không cần đồng ý do Luật Bảo vệ Dữ liệu Cá nhân (PDPL, hiệu lực 01/01/2026)Nghị định 13/2023/NĐ-CP quy định. Tài liệu nêu tinh thần chung; đối chiếu văn bản gốc hiện hành cho từng trường hợp. Trong ROPA (mục Data mapping & ROPA), mỗi hoạt động xử lý bắt buộc ghi rõ căn cứ pháp lý.

💡 Ví dụ ngân hàng

Một quy trình "mở thẻ" có thể đồng thời dựa trên nhiều căn cứ: định danh KYC dựa trên nghĩa vụ pháp lý; phát hành thẻ dựa trên thực hiện hợp đồng; gửi email marketing sản phẩm khác lại cần sự đồng ý riêng. Tách bạch căn cứ cho từng mục đích là kỹ năng quan trọng.

21. Data flow — luồng dữ liệu ↑ đầu trang

⏱ ~15 phút · Đọc & vẽ sơ đồ đường đi của dữ liệu (DFD)

Data flow (luồng dữ liệu)đường đi của dữ liệu: từ lúc được tạo/thu thập, qua các hệ thống xử lý, đến nơi lưu trữ và những nơi nó được chia sẻ. Cách thể hiện phổ biến là Data Flow Diagram (DFD).

Bốn ký hiệu cơ bản của DFD

Ký hiệuTênNghĩa
⬭ (hình tròn/bo góc)Process — Xử lýMột bước biến đổi dữ liệu (vd "Xác thực eKYC").
▭ (hình chữ nhật)External entity — Tác nhân ngoàiNguồn/đích bên ngoài (khách hàng, đối tác).
▱ (hình mở 2 cạnh)Data store — Kho dữ liệuNơi lưu (database, kho ảnh).
→ (mũi tên)Data flow — LuồngHướng dữ liệu di chuyển, ghi rõ "dữ liệu gì".
Ảnh CCCD Lưu ảnh Thông tin định danh Khách hàng (App Mobile) Xử lý eKYC (Định danh) Kho ảnh CCCD (Data store) Đối tác chấm điểm
Ví dụ DFD đơn giản: luồng dữ liệu eKYC khi mở thẻ (dữ liệu giả)
📖 Phân biệt nhanh

Data flow trả lời câu hỏi "dữ liệu chảy đi đâu, qua hệ thống nào?" — nó thiên về hình ảnh đường đi. Còn data inventorydanh sách bạn có gì, và data mappingbảng chi tiết ghép tất cả lại.

22. Data inventory — kiểm kê dữ liệu ↑ đầu trang

⏱ ~10 phút · "Chúng ta thực sự đang có dữ liệu gì?" — kèm template tải về

Data inventory (kiểm kê dữ liệu)danh sách những loại dữ liệu mà tổ chức đang nắm giữ, kèm thông tin cơ bản về chúng. Nó trả lời câu hỏi nền tảng nhất của privacy: "Chúng ta thực sự đang có dữ liệu gì?"

📋 Template Data Inventory
Tên tập dữ liệuMô tảHệ thống lưuPhân loạiData OwnerThời hạn lưu
Hồ sơ KH cá nhânThông tin định danh khách hàngCore BankingDLCN cơ bảnP. Khách hàng cá nhânTheo quy định lưu trữ
Ảnh CCCD/eKYCẢnh giấy tờ tùy thânKho ảnh (object storage)Nhạy cảmP. Vận hành số… (điền)
Log giao dịch thẻLịch sử giao dịchDB giao dịchDLCN cơ bảnP. Thẻ… (điền)

Inventory khác mapping thế nào? Inventory là "chúng ta có gì" (mức danh mục). Data mapping đi sâu hơn: từng trường dữ liệu chảy từ đâu đến đâu, vì mục đích gì, căn cứ pháp lý nào. Bạn thường làm inventory trước để có bức tranh tổng, rồi mới mapping chi tiết cho từng hoạt động xử lý quan trọng.

23. Phân loại dữ liệu (data classification) ↑ đầu trang

⏱ ~12 phút · Gắn nhãn để biết áp mức bảo vệ nào · PII vs dữ liệu nhạy cảm

Không phải dữ liệu nào cũng cần bảo vệ như nhau. Cần phân biệt HAI TRỤC độc lập — đây là chỗ rất nhiều người nhầm:

📖 Hai trục phân loại — đừng trộn lẫn
  • Trục 1 — Mức bảo mật nội bộ (security classification): Public / Internal / Confidential / Restricted. Trả lời "lộ ra thì thiệt hại tới đâu".
  • Trục 2 — Phân loại pháp lý (theo luật bảo vệ DLCN): dữ liệu cá nhân cơ bản vs nhạy cảm. Trả lời "luật yêu cầu bảo vệ thế nào".

Hai trục đi song song, không thay thế nhau: một trường có thể là "Confidential" (trục 1) "nhạy cảm" (trục 2) cùng lúc — và mỗi trục kéo theo nghĩa vụ riêng.

Trục 1 — Thang mức bảo mật (ví dụ ở ngân hàng)

NhãnNghĩaVí dụ
Public Công khaiLộ ra cũng không hạiBiểu phí công bố, thông cáo báo chí
Internal Nội bộChỉ dùng trong nội bộQuy trình nội bộ, sơ đồ tổ chức
Confidential MậtLộ ra gây thiệt hạiDữ liệu cá nhân khách hàng, số dư
Restricted Tối mậtLộ ra gây thiệt hại nghiêm trọngKhóa mã hóa, dữ liệu tối quan trọng

Trục 2 — Phân loại pháp lý: dữ liệu cá nhân cơ bản vs nhạy cảm

Dữ liệu cá nhân (cơ bản)

Thông tin xác định hoặc có thể xác định một người: họ tên, ngày sinh, CCCD, số điện thoại, email, số tài khoản…

Lưu ý: "PII" là thuật ngữ Mỹ, phạm vi hẹp hơn "dữ liệu cá nhân" theo luật VN/GDPR — đừng coi là đồng nghĩa hoàn toàn.

Dữ liệu cá nhân nhạy cảm

Loại cần bảo vệ cao hơn: sinh trắc học, sức khỏe, tài chính, quan điểm chính trị/tôn giáo, đời sống riêng tư… Theo pháp luật VN, nhóm này có yêu cầu nghiêm ngặt hơn.

⚠️ Lưu ý pháp luật VN

Pháp luật Việt Nam về bảo vệ dữ liệu cá nhân phân biệt dữ liệu cá nhân cơ bảndữ liệu cá nhân nhạy cảm, với nghĩa vụ khác nhau. Khi phân loại, hãy đánh dấu rõ trường nào nhạy cảm (trục 2) — độc lập với nhãn bảo mật (trục 1) — vì nó kéo theo yêu cầu cao hơn về sự đồng ý, bảo mật & đánh giá tác động. (Tra cứu văn bản pháp luật hiện hành để xác định danh mục chính xác.)

24. Data mapping & ROPA — trọng tâm ★ ↑ đầu trang

⏱ ~25 phút · Bài quan trọng nhất — quy trình 7 bước, lineage & template ROPA tải về

Data mapping là việc lập bản đồ chi tiết cho dữ liệu cá nhân: từng loại dữ liệu được thu thập từ đâu, chảy qua hệ thống nào, lưu ở đâu, dùng cho mục đích gì, căn cứ pháp lý nào, chia sẻ cho ai và lưu bao lâu. Đây là nền móng để xây ROPA và tuân thủ PDPL.

Phân biệt rõ 3 khái niệm hay lẫn lộn

Trả lời câu hỏiHình thứcMức chi tiết
Data inventory"Chúng ta dữ liệu gì?"Danh sách/danh mụcTổng quan
Data flow"Dữ liệu chảy đi đâu?"Sơ đồ (DFD)Đường đi
Data mapping"Toàn bộ vòng đời của dữ liệu này thế nào, gắn pháp lý gì?"Bảng chi tiếtSâu nhất — ghép cả hai cái trên

Quy trình data mapping 7 bước

  1. Xác định hoạt động xử lý / quy trình nghiệp vụ. Bắt đầu từ một quy trình cụ thể, vd "Mở thẻ tín dụng qua eKYC". Đừng cố làm cả ngân hàng cùng lúc.
  2. Liệt kê các trường dữ liệu (data elements). Họ tên, CCCD, ảnh CCCD, SĐT, thu nhập… Đánh dấu trường nào là nhạy cảm.
  3. Xác định nguồn → đích & hệ thống (data lineage). Dữ liệu vào từ đâu (app), qua hệ thống nào (eKYC, core banking), lưu ở đâu (DB, kho ảnh).
  4. Phân loại & gắn nhãn. Áp nhãn phân loại (mục Phân loại dữ liệu) cho từng trường.
  5. Ghi mục đích, căn cứ pháp lý & thời hạn lưu. Vì sao thu thập? Dựa trên đồng ý / hợp đồng / nghĩa vụ pháp lý? Giữ bao lâu?
  6. Xác định bên nhận & chuyển dữ liệu xuyên biên giới. Chia sẻ cho phòng ban/đối tác nào? Có rời khỏi Việt Nam không (cross-border)?
  7. Rà soát & duy trì. Mapping không phải làm một lần. Cập nhật khi quy trình/hệ thống thay đổi.

Data lineage — truy vết nguồn → đích

Data lineage là "gia phả" của dữ liệu: lần theo một trường dữ liệu từ nơi sinh ra, qua mọi nơi nó đi qua, đến nơi cuối cùng. Phục vụ kiểm toán (audit) — khi cơ quan quản lý hỏi "dữ liệu này từ đâu ra, đã đi những đâu?", lineage trả lời được.

📱NguồnApp eKYC
🔎Xử lýĐịnh danh
🗄️LưuCore + Kho ảnh
🤝Chia sẻĐối tác chấm điểm

Xây ROPA (Record of Processing Activities)

ROPA — Hồ sơ/Sổ ghi các hoạt động xử lý dữ liệu cá nhân — là tài liệu tuân thủ cốt lõi mà cán bộ privacy phải duy trì. Data mapping cung cấp nguyên liệu, ROPA là "thành phẩm" trình bày theo từng hoạt động xử lý. Các cột thường có:

📋 Template ROPA — điền sẵn ví dụ (dữ liệu giả)
Cột ROPAGiải thíchVí dụ: "Mở thẻ tín dụng qua eKYC"
Tên hoạt động xử lýQuy trình nghiệp vụMở thẻ tín dụng qua eKYC
Bên kiểm soát dữ liệuAi quyết định mục đích & cách xử lýNgân hàng (P. Thẻ là Data Owner)
Mục đích xử lýVì sao xử lýĐịnh danh KH, thẩm định & phát hành thẻ
Loại dữ liệuCác trường + nhãn nhạy cảmHọ tên, CCCD, ảnh CCCD, SĐT, thu nhập
Nhóm chủ thể dữ liệuDữ liệu về aiKhách hàng cá nhân
Căn cứ pháp lýĐồng ý / hợp đồng / nghĩa vụ pháp lýSự đồng ý + thực hiện hợp đồng
Bên nhận dữ liệuNội bộ/đối tác được chia sẻP. Thẩm định; đối tác chấm điểm tín dụng
Hệ thống lưu trữNơi & quốc gia lưuCore Banking (VN); Kho ảnh (region… — cần xác nhận với IT)
Chuyển xuyên biên giớiCó rời VN không + cơ chếCó/Không — nếu có: ghi nước nhận + hồ sơ
Thời hạn lưuGiữ bao lâu, khi nào xóaTheo quy định lưu trữ (điền chính xác)
Biện pháp bảo vệAn ninh áp dụngMã hóa at rest/in transit, RBAC, audit log

Cross-border transfer mapping — chuyển dữ liệu xuyên biên giới

Khi dữ liệu cá nhân của khách hàng Việt Nam rời khỏi lãnh thổ Việt Nam — ví dụ được lưu/xử lý trên cloud region ở nước ngoài, hoặc gửi cho đối tác nước ngoài — đó là chuyển dữ liệu xuyên biên giới, kéo theo nghĩa vụ tuân thủ riêng (lập hồ sơ đánh giá tác động chuyển dữ liệu, đảm bảo điều kiện theo pháp luật VN).

⚠️ Lưu ý PDPL — cross-border

Pháp luật Việt Nam (Nghị định 13/2023/NĐ-CP về bảo vệ dữ liệu cá nhân, và Luật Bảo vệ Dữ liệu Cá nhân) đặt ra yêu cầu cho việc chuyển dữ liệu cá nhân ra nước ngoài. Trong data mapping, hãy luôn có cột "dữ liệu có rời VN không?" — và nếu có, đánh dấu để xử lý hồ sơ riêng. Đây chính là lý do bạn phải hỏi IT về "region" của cloud. (Số điều khoản & thủ tục cụ thể cần tra cứu văn bản pháp luật hiện hành — tài liệu này không thay thế tư vấn pháp lý.)

Checklist rà soát một data mapping "đạt"

  • Đã gắn với một hoạt động xử lý cụ thể, có Data Owner.
  • Đã liệt kê đủ trường dữ liệu & đánh dấu trường nhạy cảm.
  • Đã truy được nguồn → đích (lineage) qua các hệ thống.
  • Mỗi hoạt động có mục đích & căn cứ pháp lý rõ ràng.
  • Có thời hạn lưu cho từng loại dữ liệu (kể cả backup).
  • Đã liệt kê bên nhận & kiểm tra cross-border.
  • Đã ghi biện pháp bảo vệ (mã hóa, phân quyền, log).
  • Có cơ chế cập nhật khi quy trình/hệ thống đổi.
💡 Bắt đầu từ đâu cho đỡ ngợp

Chọn 1 quy trình rủi ro cao (vd eKYC, mở thẻ) làm thí điểm. Dùng 7 câu hỏi ở mục Giải mã câu hỏi IT đi phỏng vấn Steward (business) & Custodian (IT). Điền vào template ROPA ở trên. Làm xong 1 cái hoàn chỉnh, các quy trình sau sẽ rất nhanh vì bạn đã có khuôn.

25. DPIA — Đánh giá tác động bảo vệ dữ liệu ↑ đầu trang

⏱ ~15 phút · "Nghĩ trước khi làm" cho các hoạt động rủi ro cao

📖 Định nghĩa

DPIA (Data Protection Impact Assessment) — Đánh giá tác động xử lý dữ liệu cá nhân — là quy trình nhận diện và giảm thiểu rủi ro đối với quyền của chủ thể dữ liệu trước khi triển khai một hoạt động xử lý có rủi ro cao.

Pháp luật Việt Nam yêu cầu lập hồ sơ đánh giá tác động xử lý dữ liệu cá nhân (và hồ sơ riêng cho chuyển dữ liệu ra nước ngoài). DPIA đặc biệt cần khi:

  • Xử lý quy mô lớn dữ liệu cá nhân, hoặc dữ liệu nhạy cảm.
  • Dùng công nghệ mới (AI, chấm điểm tự động, sinh trắc học).
  • Giám sát có hệ thống, hoặc ra quyết định tự động ảnh hưởng lớn tới khách hàng.
  • Chuyển dữ liệu xuyên biên giới.

Khung 5 bước làm DPIA

  1. Mô tả hoạt động xử lý. Dữ liệu gì, mục đích, luồng (dùng data mapping mục Data mapping & ROPA).
  2. Đánh giá sự cần thiết & tương xứng. Có cách ít xâm phạm hơn không? Có đúng nguyên tắc tối thiểu hóa?
  3. Nhận diện rủi ro với quyền & lợi ích của chủ thể (lộ lọt, dùng sai mục đích, phân biệt đối xử...).
  4. Đề xuất biện pháp giảm thiểu (mã hóa, hạn chế truy cập, ẩn danh, rút ngắn thời gian lưu).
  5. Kết luận & phê duyệt; lưu hồ sơ, rà soát định kỳ.
💡 Ví dụ ngân hàng

Ngân hàng muốn dùng AI chấm điểm tín dụng dựa trên hành vi chi tiêu → đây là xử lý rủi ro cao (ra quyết định tự động ảnh hưởng quyền tiếp cận tín dụng). Phải làm DPIA trước: đánh giá nguy cơ thiên kiến, sai sót, và cách khách hàng có thể khiếu nại.

📖 Đừng nhầm DPIA với "hồ sơ chuyển dữ liệu ra nước ngoài"

Đây là hai hồ sơ riêng: (1) DPIA — đánh giá tác động xử lý DLCN; (2) Hồ sơ đánh giá tác động chuyển DLCN ra nước ngoài (TIA) — khi dữ liệu rời lãnh thổ VN. Một dự án dùng cloud nước ngoài thường cần cả hai. Cơ quan tiếp nhận là cơ quan chuyên trách thuộc Bộ Công an (A05) theo quy định hiện hành. Lưu ý: hồ sơ DPIA/TIA không chỉ "lập rồi để đó" — theo quy định, phải chủ động gửi cho cơ quan chuyên trách trong một thời hạn nhất định sau khi bắt đầu xử lý (và cập nhật khi có thay đổi). Tra cứu thời hạn cụ thể trong văn bản hiện hành.

📋 Template DPIA — khung điền sẵn (dữ liệu giả)
Mục DPIANội dung điền (ví dụ: chấm điểm tín dụng bằng AI)
Hoạt động xử lýChấm điểm tín dụng tự động bằng AI khi mở thẻ
Mô tả dữ liệu & luồngLịch sử giao dịch, thu nhập, CCCD → mô hình AI (đối tác) → kết quả điểm
Mục đích & sự cần thiếtThẩm định rủi ro tín dụng; có cách ít xâm phạm hơn không?
Căn cứ pháp lýThực hiện hợp đồng + (một số dữ liệu) nghĩa vụ pháp lý
Rủi ro với chủ thểThiên kiến/phân biệt đối xử; từ chối oan; thiếu minh bạch
Biện pháp giảm thiểuKiểm thử thiên kiến; có người rà soát; cơ chế giải thích & khiếu nại
Chuyển xuyên biên giới?Có (đối tác nước ngoài) → cần thêm hồ sơ TIA
Kết luận & phê duyệtMức rủi ro còn lại; người phê duyệt; ngày rà soát lại

26. Quyền của chủ thể dữ liệu (DSAR) ↑ đầu trang

⏱ ~15 phút · Khách hàng có quyền gì với dữ liệu của họ

Chủ thể dữ liệu (data subject) — tức khách hàng/nhân viên — có một loạt quyền mà ngân hàng phải đáp ứng.

📖 Lưu ý thuật ngữ: DSAR vs DSR

DSAR (Data Subject Access Request) theo nghĩa gốc chỉ là quyền truy cập. Trong thực hành, nhiều tổ chức (và tài liệu này) dùng "DSAR" theo nghĩa rộng để gọi chung mọi yêu cầu thực thi quyền của chủ thể — chính xác hơn nên gọi là DSR (Data Subject Request). Khi thi chứng chỉ (CIPP) hãy nhớ phân biệt này.

QuyềnNghĩaVí dụ yêu cầu
Được biết / minh bạchBiết dữ liệu của mình bị xử lý thế nào."Ngân hàng dùng SĐT của tôi vào việc gì?"
Truy cậpXem/lấy bản sao dữ liệu của mình."Cho tôi xin bản sao dữ liệu các anh đang giữ."
Chỉnh sửaSửa dữ liệu sai/cũ."Cập nhật địa chỉ mới của tôi."
XóaYêu cầu xóa (trong điều kiện luật cho phép)."Xóa dữ liệu của tôi sau khi đóng tài khoản."
Rút lại sự đồng ýNgừng việc dựa trên đồng ý."Tôi không muốn nhận quảng cáo nữa."
Phản đối / hạn chếPhản đối một số hình thức xử lý."Đừng dùng dữ liệu của tôi để tiếp thị."
Liên quan quyết định tự độngKhông bị áp đặt quyết định hoàn toàn tự động gây ảnh hưởng lớn mà không có sự can thiệp của con người."Tôi muốn người thật xem lại việc bị AI từ chối khoản vay."
Khiếu nạiKhiếu nại tới cơ quan có thẩm quyền.Gửi đơn tới cơ quan quản lý (vd A05).
⚠️ Vì sao data mapping là "vũ khí" cho DSAR

Khi khách yêu cầu "cho tôi xem/xóa toàn bộ dữ liệu của tôi", bạn phải tìm dữ liệu họ ở mọi hệ thống — core, CRM, kho ảnh, backup, file của đối tác. Nếu đã có data mapping & inventory tốt (các mục Data inventoryData mapping), bạn trả lời trong vài giờ. Nếu không, có thể mất nhiều tuần và sót dữ liệu → vi phạm.

⚠️ Quyền "được xóa" KHÔNG tuyệt đối — bẫy lớn nhất ở ngân hàng

Khi khách yêu cầu xóa, ngân hàng thường KHÔNG xóa được ngay vì còn nghĩa vụ pháp lý: lưu trữ chứng từ giao dịch, hồ sơ phòng chống rửa tiền (AML), quy định lưu trữ ngành ngân hàng. Cách xử lý đúng: giải thích cho khách phần nào phải giữ & căn cứ, xóa/ẩn những phần không còn căn cứ giữ, và ghi nhận lại quyết định. Đừng hứa "xóa sạch" khi luật buộc phải giữ.

⚠️ Dữ liệu trẻ em & người chưa thành niên

Xử lý dữ liệu cá nhân của trẻ em/người chưa thành niên có yêu cầu chặt hơn (vd cần sự đồng ý của cha mẹ/người giám hộ, xác minh tuổi). Nếu ngân hàng có sản phẩm cho nhóm dưới 18 tuổi, đây là điểm DPIA & kiểm soát đặc biệt. Tra cứu điều kiện cụ thể theo luật hiện hành.

27. Quản lý bên thứ ba / nhà cung cấp ↑ đầu trang

⏱ ~12 phút · Dữ liệu của bạn nằm trong tay người khác

Ngân hàng hiếm khi tự làm mọi thứ — họ thuê đối tác xử lý dữ liệu: nhà cung cấp eKYC, tổng đài thuê ngoài, cloud, công ty chấm điểm tín dụng. Hai vai trò cần phân biệt:

Bên Kiểm soát dữ liệu (Controller)

Bên quyết định mục đích & cách xử lý. Thường là ngân hàng. Chịu trách nhiệm chính.

Bên Xử lý dữ liệu (Processor)

Bên xử lý thay mặt controller theo chỉ dẫn. VD: nhà cung cấp cloud, đối tác eKYC.

🏦 Điểm kiểm soát quan trọng
  • Hợp đồng xử lý dữ liệu (DPA): ràng buộc đối tác về bảo mật, mục đích, thời hạn, xóa dữ liệu khi kết thúc.
  • Thẩm định trước khi ký (due diligence): đối tác có biện pháp bảo vệ phù hợp không?
  • Vị trí lưu trữ: đối tác lưu dữ liệu ở đâu? Có ra nước ngoài không?
  • Quyền kiểm tra (audit): bạn có quyền rà soát đối tác không?
🔑 Ghi nhớ

Khi bạn thuê ngoài việc xử lý, bạn không thuê ngoài được trách nhiệm. Nếu đối tác làm lộ dữ liệu khách hàng, ngân hàng (controller) vẫn chịu trách nhiệm trước pháp luật & khách hàng.

28. Sự cố lộ lọt dữ liệu (data breach) ↑ đầu trang

⏱ ~15 phút · Khi chuyện xấu xảy ra — phản ứng thế nào

📖 Định nghĩa

Sự cố lộ lọt dữ liệu cá nhân là sự kiện làm dữ liệu cá nhân bị truy cập, tiết lộ, thay đổi, mất mát hoặc phá hủy trái phép — dù do tấn công mạng, lỗi nội bộ hay gửi nhầm.

Quy trình ứng phó 6 bước

  1. Phát hiện & ghi nhận. Ai báo, lúc nào, dấu hiệu gì.
  2. Ngăn chặn (containment). Khóa tài khoản, ngắt hệ thống bị xâm nhập.
  3. Đánh giá mức độ. Dữ liệu gì, bao nhiêu người, có nhạy cảm không, hậu quả?
  4. Thông báo. Báo nội bộ, cơ quan có thẩm quyền & chủ thể dữ liệu theo thời hạn luật định.
  5. Khắc phục. Vá lỗ hổng, hỗ trợ khách hàng bị ảnh hưởng.
  6. Rút kinh nghiệm. Cập nhật biện pháp, lưu hồ sơ sự cố.
⚠️ Lưu ý PDPL — nghĩa vụ thông báo

Pháp luật Việt Nam quy định nghĩa vụ thông báo vi phạm dữ liệu cá nhân cho cơ quan có thẩm quyền (và trong nhiều trường hợp cả chủ thể dữ liệu) trong một khung thời gian nhất định kể từ khi phát hiện. Đầu mối là cơ quan chuyên trách bảo vệ DLCN thuộc Bộ Công an (Cục A05); với ngân hàng còn có nghĩa vụ báo cáo NHNN/SBV theo quy định an toàn HTTT. Pháp luật VN cũng yêu cầu thông báo cấp tốc (tham khảo mốc 72 giờ kể từ khi phát hiện — tương đồng GDPR; con số & ngoại lệ cụ thể của VN phải tra cứu trong văn bản hiện hành). Phối hợp Pháp chế để chốt thời hạn & mẫu thông báo. Chuẩn bị sẵn quy trình & mẫu trước khi sự cố xảy ra là việc của privacy.

29. Khung pháp lý Việt Nam ↑ đầu trang

⏱ ~18 phút · Bản đồ các luật bạn cần biết (mức tổng quan)

Privacy ở ngân hàng Việt Nam chịu sự điều chỉnh của nhiều văn bản. Bảng dưới là bản đồ tổng quan — không phải tư vấn pháp lý; số hiệu & điều khoản cần tra cứu bản gốc hiện hành.

Văn bảnPhạm viLiên quan privacy thế nào
Luật Bảo vệ Dữ liệu Cá nhân (PDPL) — hiệu lực 01/01/2026Văn bản cấp luật, cao nhất về bảo vệ DLCNKhung nền tảng hiện hành: nguyên tắc, căn cứ xử lý, quyền chủ thể, đánh giá tác động, chuyển dữ liệu ra nước ngoài, chế tài. (Tra cứu số hiệu & điều khoản bản gốc.)
Nghị định 13/2023/NĐ-CP (PDPD)Văn bản dưới luật về bảo vệ DLCNVăn bản nền móng đầu tiên (từ 2023); cụ thể hóa nhiều nội dung, áp dụng song song với Luật theo hướng dẫn hiện hành.
Luật An ninh mạng & nghị định hướng dẫnAn ninh không gian mạngYêu cầu liên quan lưu trữ dữ liệu, bảo vệ hệ thống thông tin.
Luật An toàn thông tin mạngAn toàn thông tinBảo vệ thông tin cá nhân trên mạng, phân loại hệ thống thông tin theo cấp độ.
Luật Giao dịch điện tửGiao dịch điện tửLiên quan eKYC, chữ ký số, dữ liệu điện tử.
Quy định của SBV/NHNN (vd Thông tư về an toàn HTTT ngân hàng)Ngành ngân hàngYêu cầu riêng về an toàn hệ thống, bảo mật, bảo vệ thông tin khách hàng.
Luật liên quan đến AI (2025)Trí tuệ nhân tạoKhi dùng AI xử lý dữ liệu cá nhân (chấm điểm, sinh trắc học) — cần lưu ý nghĩa vụ minh bạch & quản trị rủi ro. Tra cứu văn bản hiện hành.
🏦 Hai hồ sơ & đầu mối cơ quan quản lý — DPO bắt buộc nắm

Pháp luật VN yêu cầu lập hai loại hồ sơ riêng biệt, dễ bị nhầm là một:

  • Hồ sơ đánh giá tác động xử lý DLCN (DPIA) — cho hoạt động xử lý dữ liệu cá nhân (xem mục DPIA).
  • Hồ sơ đánh giá tác động chuyển DLCN ra nước ngoài (TIA) — khi dữ liệu rời lãnh thổ VN (vd lưu trên cloud quốc tế).

Đầu mối: cơ quan chuyên trách bảo vệ DLCN thuộc Bộ Công an (Cục An ninh mạng & phòng, chống tội phạm sử dụng công nghệ cao — A05) là nơi tiếp nhận hồ sơ & xử lý vi phạm; song song với nghĩa vụ báo cáo Ngân hàng Nhà nước (SBV/NHNN) theo quy định an toàn HTTT ngân hàng. (Tên gọi/thẩm quyền có thể thay đổi — tra cứu văn bản hiện hành.) Luôn đánh dấu yếu tố cross-border trong data mapping (mục Data mapping & ROPA).

⚠️ Miễn trừ

Mục này chỉ nhằm giúp bạn định hướng. Mọi quyết định tuân thủ phải dựa trên văn bản pháp luật hiện hành & ý kiến của bộ phận Pháp chế. Đừng trích dẫn số điều khoản từ trí nhớ.

✎ Bài tập Module 3
  1. Một quy trình gửi email marketing cho khách hàng nên dựa trên căn cứ pháp lý nào? Vì sao không nên dùng "thực hiện hợp đồng"?
  2. Liệt kê 5 cột bắt buộc tối thiểu trong một ROPA.
  3. Khách hàng yêu cầu "xóa toàn bộ dữ liệu của tôi". Bạn sẽ kiểm tra những hệ thống/nơi lưu nào? Công cụ nào ở các bài trước giúp bạn?
  4. Khi nào một hoạt động xử lý cần làm DPIA? Cho 2 ví dụ ở ngân hàng.
  5. Phát hiện một nhân viên gửi nhầm file chứa danh sách 500 khách hàng ra email ngoài. Liệt kê 6 bước bạn xử lý.
  6. Ngân hàng thuê đối tác cloud nước ngoài lưu dữ liệu KYC. Nêu 3 điểm kiểm soát privacy bạn phải đảm bảo.

→ Xem gợi ý đáp án ở mục Đáp án bài tập.

📝 Trắc nghiệm Module 3 10 câu · cần đúng ≥ 7 để ĐẠT

Module 4 ~1 giờ

Mở rộng tầm nhìn

Dữ liệu không chỉ để tuân thủ — nó tạo giá trị. Hiểu thêm về phân tích dữ liệu, AI và một case study tổng hợp tất cả.

30. Phân tích & trực quan hóa dữ liệu (BI) ↑ đầu trang

⏱ ~12 phút · Biến dữ liệu thành quyết định

BI (Business Intelligence) là việc dùng dữ liệu để hỗ trợ ra quyết định, thường qua báo cáo & dashboard. Vài khái niệm để bạn nói chuyện với đội phân tích:

Thuật ngữNghĩa
Data Warehouse (kho dữ liệu)Nơi gom dữ liệu từ nhiều hệ thống để phân tích.
Data Lake (hồ dữ liệu)Kho lớn chứa dữ liệu thô đủ loại (kể cả phi cấu trúc).
DashboardMàn hình trực quan hóa số liệu (biểu đồ, KPI).
KPI / MetricChỉ số đo lường (vd số thẻ mở mới/tháng).
Report (báo cáo)Tổng hợp số liệu theo định kỳ.
⚠️ Lưu ý privacy

Kho dữ liệu & dashboard là nơi privacy hay bị "quên": dữ liệu cá nhân từ nhiều nguồn dồn về một chỗ, nhiều người xem. Hãy đảm bảo báo cáo dùng dữ liệu tổng hợp/ẩn danh khi có thể, và phân quyền chặt cho dashboard chứa dữ liệu cá nhân.

31. AI, dữ liệu lớn & privacy ↑ đầu trang

⏱ ~15 phút · Công nghệ mới, rủi ro mới

Ngân hàng ngày càng dùng AI/Machine LearningBig Data: chấm điểm tín dụng, phát hiện gian lận, chatbot, gợi ý sản phẩm. Vài khái niệm & rủi ro privacy:

Khái niệmNghĩa nôm na
Machine LearningMáy "học" quy luật từ dữ liệu thay vì được lập trình cứng.
Training data (dữ liệu huấn luyện)Dữ liệu dùng để dạy mô hình — thường chứa dữ liệu cá nhân.
Mô hình (model)"Bộ não" đã học, đưa ra dự đoán.
Big Data (3V)Volume (lượng lớn), Velocity (tốc độ), Variety (đa dạng). Một số tài liệu mở rộng thành 5V — thêm Veracity (độ tin cậy) & Value (giá trị).
Quyết định tự độngHệ thống tự ra quyết định không cần người (vd duyệt/từ chối vay).
⚠️ Rủi ro privacy đặc thù của AI
  • Dùng dữ liệu sai mục đích: dữ liệu thu cho việc A đem huấn luyện mô hình cho việc B.
  • Thiên kiến & phân biệt đối xử: mô hình học từ dữ liệu lệch → đối xử bất công.
  • Thiếu minh bạch ("hộp đen"): khó giải thích vì sao khách bị từ chối.
  • Quyết định tự động: chủ thể có quyền không bị quyết định hoàn toàn tự động trong nhiều trường hợp.
🏦 Lưu ý tuân thủ

Việt Nam đã có khung pháp lý về AI (2025) bên cạnh pháp luật bảo vệ dữ liệu cá nhân. Khi ngân hàng triển khai AI xử lý dữ liệu cá nhân, hãy: làm DPIA (xem mục DPIA), đảm bảo có căn cứ pháp lý cho dữ liệu huấn luyện, và chuẩn bị cơ chế giải thích & khiếu nại cho khách hàng. Tra cứu văn bản hiện hành để biết nghĩa vụ cụ thể.

32. Case study tổng hợp ↑ đầu trang

⏱ ~18 phút · Ráp tất cả lại thành một câu chuyện

Hãy đi qua một tình huống thực tế (dữ liệu giả) để thấy mọi mảnh ghép khớp với nhau thế nào.

Bối cảnh: Ngân hàng ra mắt tính năng "Mở thẻ tín dụng online qua eKYC" trên app. Khách chụp CCCD, selfie, khai thu nhập. Hệ thống định danh, một đối tác nước ngoài chấm điểm tín dụng bằng AI, rồi ngân hàng quyết định cấp thẻ. — Tình huống minh họa, dữ liệu giả

Bạn — cán bộ privacy — làm gì?

Việc cần làmDùng kiến thức mục
Hỏi IT: dữ liệu lưu ở đâu (core? kho ảnh? cloud nào, region nào?)Hạ tầng, Database, Cloud
Vẽ data flow: app → eKYC → core/kho ảnh → đối tác chấm điểmData flow
Lập inventory & phân loại: CCCD ảnh = nhạy cảm, selfie sinh trắc = nhạy cảmInventory, Phân loại
Làm data mapping & ROPA cho quy trìnhData mapping & ROPA
Xác định căn cứ pháp lý: KYC (nghĩa vụ pháp lý) + phát hành thẻ (hợp đồng) + marketing (đồng ý riêng)Căn cứ pháp lý
Phát hiện đối tác chấm điểm ở nước ngoài + dùng AI quyết định tự động → làm DPIA + hồ sơ chuyển dữ liệu xuyên biên giớiDPIA, Luật VN, AI
Ký DPA với đối tác, kiểm tra biện pháp bảo vệBên thứ ba
Chuẩn bị quy trình đáp ứng DSAR & ứng phó sự cốDSAR, Sự cố
🔑 Ghi nhớ — bức tranh lớn

Một tính năng tưởng đơn giản đã chạm tới gần như toàn bộ khóa học. Đó là lý do người làm privacy cần data literacy: bạn là người duy nhất nhìn thấy dữ liệu cá nhân chảy xuyên suốt mọi hệ thống & phòng ban — và đảm bảo nó được tôn trọng ở từng điểm.

✎ Bài tập Module 4
  1. Đội phân tích muốn xây dashboard doanh thu theo từng khách hàng cho toàn chi nhánh xem. Nêu 2 rủi ro privacy và 2 biện pháp giảm thiểu bạn đề xuất.
  2. Ngân hàng muốn huấn luyện mô hình AI phát hiện gian lận từ lịch sử giao dịch khách hàng. Liệt kê 3 câu hỏi privacy bạn phải đặt trước khi đồng ý.
  3. Một mô hình AI từ chối khoản vay của khách mà không giải thích được lý do. Đây là rủi ro privacy nào, và quyền nào của khách hàng bị ảnh hưởng?

→ Xem gợi ý đáp án ở mục Đáp án bài tập.

📝 Trắc nghiệm Module 4 10 câu · cần đúng ≥ 7 để ĐẠT

Module 5 ~1.5 giờ

Trở thành Data Protection Officer (DPO)

Phần "deep research" gói gọn: DPO thực sự làm gì, ai chịu trách nhiệm gì (RACI), và bạn cần hiểu dữ liệu tới mức nào để làm tốt vai trò này. Đây là đích đến của cả khóa học.

33. Vai trò Data Protection Officer (deep-dive) ↑ đầu trang

⏱ ~30 phút · Chân dung đầy đủ của nghề DPO

📖 Định nghĩa

Data Protection Officer (DPO) — Cán bộ bảo vệ dữ liệu cá nhân — là người (hoặc bộ phận) chịu trách nhiệm giám sát, tư vấn và điều phối việc tuân thủ pháp luật bảo vệ dữ liệu cá nhân trong tổ chức. DPO là cầu nối giữa nghiệp vụ, IT, pháp chế, lãnh đạo, cơ quan quản lý và chính khách hàng.

33.1 DPO làm gì? — 7 nhóm nhiệm vụ cốt lõi

Nhóm nhiệm vụViệc cụ thể (gắn với khóa học)
1. Tư vấn & định hướngTư vấn cho lãnh đạo & nghiệp vụ về nghĩa vụ pháp lý; tham gia từ đầu các dự án có dữ liệu cá nhân ("privacy by design").
2. Giám sát tuân thủTheo dõi việc áp dụng nguyên tắc bảo vệ DLCN, chính sách, quy trình; rà soát định kỳ.
3. Lập & duy trì hồ sơĐiều phối data mapping & ROPA, data inventory, hồ sơ chứng minh tuân thủ.
4. Đánh giá rủi roTổ chức thực hiện DPIA cho hoạt động rủi ro cao & hồ sơ chuyển dữ liệu xuyên biên giới.
5. Đầu mối với chủ thể dữ liệuTiếp nhận & điều phối xử lý yêu cầu của khách hàng (DSAR), khiếu nại.
6. Đầu mối với cơ quan quản lýLiên hệ, báo cáo, phối hợp với cơ quan có thẩm quyền; xử lý thông báo sự cố.
7. Đào tạo & nâng cao nhận thứcTổ chức đào tạo cho nhân viên — vì con người là mắt xích yếu nhất.

33.2 Hai nguyên tắc "bất khả xâm phạm" của vị trí DPO

① Tính độc lập

DPO không bị chỉ đạo về cách thực hiện nhiệm vụ chuyên môn, báo cáo trực tiếp tới cấp lãnh đạo cao nhất, và không bị sa thải/xử phạt vì làm đúng việc. Độc lập để dám nói "không".

② Tránh xung đột lợi ích

DPO không nên đồng thời là người quyết định mục đích & cách xử lý dữ liệu (vd không kiêm Trưởng phòng Marketing). Vì sẽ "vừa đá bóng vừa thổi còi".

🔑 Ghi nhớ — điểm dễ hiểu sai nhất

DPO KHÔNG phải là người "chịu trách nhiệm cuối cùng" về tuân thủ. Trách nhiệm đó thuộc về bên kiểm soát dữ liệu — tức tổ chức & ban lãnh đạo (xem mục Controller/Processor). DPO tư vấn & giám sát; lãnh đạo chịu trách nhiệm & quyết định. Hiểu đúng điều này là nền tảng của ma trận RACI ở bài kế tiếp.

33.3 DPO ở ngân hàng — bối cảnh đặc thù Việt Nam

  • Khối lượng dữ liệu cá nhân khổng lồ, nhiều dữ liệu nhạy cảm (tài chính, sinh trắc học eKYC).
  • Chịu nhiều tầng quy định: bảo vệ DLCN + quy định SBV/NHNN + an ninh mạng.
  • Phụ thuộc nhiều bên thứ ba (cloud, eKYC, chấm điểm) → công việc quản lý nhà cung cấp rất nặng.
  • DPO ngân hàng thường phối hợp chặt với Tuân thủ (Compliance), An ninh thông tin (CISO)Pháp chế.

33.4 Kỹ năng của một DPO giỏi

Kỹ năng "cứng" (hard skills)

  • Hiểu luật bảo vệ dữ liệu & quy định ngành
  • Data literacy (toàn bộ khóa này!) + đọc được SQL/luồng dữ liệu
  • Quản lý rủi ro & viết DPIA/ROPA
  • Hiểu cơ bản về IT, cloud, an ninh mạng

Kỹ năng "mềm" (soft skills)

  • Giao tiếp & "dịch" giữa dân luật ↔ dân IT ↔ nghiệp vụ
  • Thuyết phục & đàm phán (dám nói "không" có lý lẽ)
  • Chính trực & độc lập
  • Tư duy hệ thống — nhìn dữ liệu chảy xuyên suốt
❓ FAQ — Một ngày của DPO trông thế nào?

Sáng: rà một DPIA cho dự án app mới. Trưa: họp với IT về region lưu dữ liệu trên cloud. Chiều: xử lý một DSAR khách yêu cầu xóa dữ liệu, query (hoặc nhờ query) để tìm mọi bản ghi. Cuối ngày: cập nhật ROPA, soạn email tư vấn cho phòng Marketing về một chiến dịch. → Bạn thấy đó, mọi bài trong khóa này đều xuất hiện trong một ngày làm việc.

34. Ma trận RACI chi tiết cho bảo vệ dữ liệu ↑ đầu trang

⏱ ~25 phút · "Ai làm gì" — công cụ chống đùn đẩy & bỏ sót

📖 RACI là gì?

RACI là cách phân vai cho từng hoạt động theo 4 mức:

R Responsible — Người trực tiếp làm A Accountable — Người chịu trách nhiệm cuối (chỉ 1/hoạt động) C Consulted — Được tham vấn (hai chiều) I Informed — Được thông báo (một chiều)

Dưới đây là ma trận RACI mẫu tham khảo cho các hoạt động bảo vệ dữ liệu cá nhân ở một ngân hàng. Lưu ý: mỗi tổ chức điều chỉnh khác nhau — đây là khung để bạn tùy biến, không phải chuẩn cứng.

Hoạt động ↓ / Vai trò → Ban LĐ
(Controller)
DPO Data Owner
(Nghiệp vụ)
Data Steward IT /
Custodian
An ninh TT
(CISO)
Pháp chế
Lập & duy trì ROPAARCCIIC
Phân loại dữ liệuICARCC
Data mapping / data flowIACRCI
Xác định căn cứ pháp lýIACIC
Thực hiện DPIAARRCCCC
Phê duyệt xử lý rủi ro caoACRIICC
Xử lý yêu cầu chủ thể (DSAR)IARRRIC
Ký hợp đồng xử lý DL (DPA)ICAIICR
Cấu hình bảo mật (mã hóa, phân quyền)ICIIRA
Ứng phó sự cố lộ lọtICCIRAC
Thông báo cơ quan quản lýARIIICC
Quyết định chuyển DL xuyên biên giớiARCICCC
Đào tạo nhận thức privacyIACIICC
Giám sát tuân thủ & auditIAIIICC
🔑 Đọc ma trận này thế nào
  • Để ý: với các quyết định nghiệp vụ (phê duyệt xử lý, ký DPA), DPO chỉ là C (tham vấn bắt buộc) chứ không là A — đúng nguyên tắc độc lập & tránh xung đột lợi ích.
  • DPO là A ở các việc thuộc chức năng chuyên môn/giám sát độc lập: xác định căn cứ pháp lý, data mapping, xử lý DSAR, đào tạo, đầu mối cơ quan quản lý, giám sát tuân thủ.
  • Ban lãnh đạo (controller) là A ở các quyết định & nghĩa vụ tuân thủ cấp cao — vì họ chịu trách nhiệm cuối cùng.
  • Mỗi hàng chỉ có đúng một A — quy tắc vàng của RACI để không ai đùn đẩy.
  • Làm rõ vai A của DPO ở DSAR: DPO chịu trách nhiệm đảm bảo yêu cầu được đáp ứng đúng quy trình & đúng thời hạn — KHÔNG phải người trực tiếp thao tác xem/sửa/xóa trên hệ thống (việc đó là R của Data Owner/IT). Tách bạch này giữ đúng tính độc lập.
  • Lưu ý mô hình: ở một số ngân hàng, "giám sát độc lập/audit" do Kiểm toán nội bộ (Internal Audit) giữ vai A, còn DPO là R/C — tùy cơ cấu tổ chức.
⚠️ Lưu ý

Đây là khung tham khảo. Cơ cấu thực tế (vd có thêm Compliance, Internal Audit, HR) và việc phân A/R tùy thuộc mô hình tổ chức & quy định nội bộ của từng ngân hàng. Hãy dùng làm điểm khởi đầu rồi tùy biến cùng Pháp chế & lãnh đạo.

Lưu ý về Bên thứ ba (Processor): với các hoạt động như DSAR, ứng phó sự cố, chuyển dữ liệu xuyên biên giới — bên xử lý/đối tác (processor) thường giữ vai C/I (phối hợp cung cấp/thực thi theo chỉ dẫn). Trách nhiệm cuối vẫn ở bên kiểm soát; ràng buộc processor qua hợp đồng DPA (xem mục Quản lý bên thứ ba).

35. DPO cần hiểu data tới mức nào? ↑ đầu trang

⏱ ~20 phút · Tự đánh giá năng lực & lộ trình phát triển

Câu hỏi cốt lõi mà khóa học này trả lời: một DPO cần giỏi kỹ thuật đến đâu? Câu trả lời: đủ để hỏi đúng câu, hiểu câu trả lời, và kiểm chứng được — không cần tự xây hệ thống. Dưới đây là bản đồ năng lực theo mức.

Năng lựcMức DPO cần đạtNghĩa là làm được gì
Khái niệm dữ liệu (DIKW, loại dữ liệu, vòng đời)🟢🟢🟢 Thành thạoNền tảng bắt buộc — phân biệt & phân loại dữ liệu chuẩn xác.
DAMA / quản trị dữ liệu🟢🟢 VữngHiểu khung, biết privacy nằm ở đâu trong tổ chức.
Database & SQL🟢🟢 Đọc & viết SELECT cơ bảnTự kiểm chứng dữ liệu, hỗ trợ DSAR & audit; KHÔNG cần làm DBA.
Cloud & hạ tầng🟢🟢 Hiểu khái niệmBiết hỏi về region/residency, cross-border; không cần tự cấu hình.
An ninh thông tin🟢🟢 Hiểu khái niệmĐánh giá biện pháp bảo vệ "phù hợp" chưa; phối hợp CISO khi có sự cố.
Pháp luật bảo vệ DLCN🟢🟢🟢 Thành thạoSân nhà — nguyên tắc, căn cứ pháp lý, quyền chủ thể, cross-border.
Quản lý rủi ro (DPIA/ROPA)🟢🟢🟢 Thành thạoTự chủ trì & viết được.
Lập trình / xây hệ thống⚪ Không bắt buộcĐể IT lo. DPO chỉ cần "đọc hiểu", không cần "xây".
💡 Quy tắc 70-20-10 cho DPO

Một DPO ngân hàng hiệu quả thường dành ~70% năng lực vào pháp lý + quản trị rủi ro (sân nhà), ~20% vào data literacy (hiểu dữ liệu & SQL để kiểm chứng), và ~10% vào IT/security (đủ để đối thoại). Khóa học này trang bị trọn vẹn 20% + 10% đó — phần thường thiếu ở người xuất thân business/pháp lý.

35.1 Tự đánh giá nhanh — bạn đã sẵn sàng tới đâu?

  • Tôi phân biệt được dữ liệu cá nhân cơ bản & nhạy cảm.
  • Tôi đọc hiểu một câu lệnh SQL SELECT … WHERE.
  • Tôi biết hỏi IT "dữ liệu lưu ở cloud nào, region nào".
  • Tôi tự vẽ được data flow cho một quy trình đơn giản.
  • Tôi điền được một dòng ROPA hoàn chỉnh.
  • Tôi biết khi nào cần làm DPIA.
  • Tôi nắm quy trình ứng phó khi có sự cố lộ lọt.
  • Tôi hiểu RACI & biết ai chịu trách nhiệm gì.
Tick được ≥ 6/8? Bạn đã có nền tảng data literacy của một DPO. Hãy hoàn thành nốt các bài trắc nghiệm để khẳng định.

35.2 Lộ trình phát triển sự nghiệp DPO

🌱Nền tảngData + Privacy literacy
🛠️Thực hànhROPA · DPIA · DSAR
📜Chứng chỉCIPP/CIPM... (tùy chọn)
👔DPOĐộc lập · báo cáo BLĐ
❓ FAQ — Có cần chứng chỉ không?

Chứng chỉ quốc tế (vd dòng CIPP/CIPM/CIPT của IAPP) không bắt buộc nhưng giúp hệ thống hóa kiến thức & tăng uy tín. Quan trọng hơn chứng chỉ là năng lực thực chiến: làm được ROPA/DPIA thật, hiểu dữ liệu thật. Khóa học này chính là bước nền vững chắc trước khi bạn đầu tư vào chứng chỉ.

🔑 Lời kết của trainer

Nghề DPO không phải là "biết tuốt về luật" hay "rành tuốt về IT" — mà là người kết nối được hai thế giới đó và đặt con người (chủ thể dữ liệu) làm trung tâm. Bạn đã đi hết hành trình từ "dữ liệu là gì" tới ma trận RACI. Phần còn lại là thực hành, thực hành, và thực hành. Chúc bạn trở thành một DPO mà cả IT lẫn nghiệp vụ đều muốn ngồi xuống lắng nghe. 🎓

✎ Bài tập Module 5
  1. Trưởng phòng Marketing được đề xuất kiêm nhiệm DPO để "tiết kiệm nhân sự". Bạn phản biện thế nào? Dựa trên nguyên tắc nào?
  2. Cho hoạt động "Thông báo sự cố lộ lọt cho cơ quan quản lý": hãy tự gán RACI cho 4 vai trò (Ban lãnh đạo, DPO, IT, Pháp chế) và giải thích.
  3. Tự chấm bản thân theo checklist 8 mục ở mục "DPO cần hiểu data tới đâu". Bạn tick được mấy mục? Hai mục yếu nhất của bạn là gì và kế hoạch cải thiện?

→ Xem gợi ý đáp án ở mục Đáp án bài tập.

📝 Trắc nghiệm Module 5 10 câu · cần đúng ≥ 7 để ĐẠT

🎓 Hoàn thành cả 5 trắc nghiệm = bạn đã sẵn sàng cho con đường Data Protection Officer! Trạng thái ĐẠT được lưu lại (đánh dấu ✓ ở mục lục). Khi đạt đủ 5/5, mục Chứng nhận hoàn thành bên dưới sẽ tự mở.

🎉 Bạn đã hoàn thành cả 5 module! Nhập tên để xuất chứng nhận:

Mẹo: trong hộp thoại in, chọn "Save as PDF" để lưu file.

🎓

Chứng nhận hoàn thành

Data Literacy cho DPO tương lai

Chứng nhận rằng

Học viên

đã hoàn thành toàn bộ 5 module · 35 bài học và vượt qua cả 5 bài trắc nghiệm của khóa Data Literacy nền tảng cho người làm Privacy (chuẩn DAMA-DMBOK).

Cấp ngày —

Khóa tự học · Chứng nhận mang tính ghi nhận nỗ lực học tập, không phải chứng chỉ hành nghề.

Glossary — tra nhanh thuật ngữ Việt–Anh ↑ đầu trang

Tiếng ViệtEnglishNghĩa ngắn
Dữ liệu cá nhânPersonal DataThông tin xác định một người (luật VN/GDPR). "PII" là thuật ngữ Mỹ, phạm vi hẹp hơn — không đồng nghĩa hoàn toàn.
Quản trị dữ liệuData GovernanceChính sách & vai trò quản lý dữ liệu
Vòng đời dữ liệuData LifecycleThu thập → … → hủy
Luồng dữ liệuData FlowĐường đi của dữ liệu
Kiểm kê dữ liệuData InventoryDanh mục dữ liệu đang giữ
Lập bản đồ dữ liệuData MappingBảng chi tiết vòng đời dữ liệu
Truy vết dữ liệuData LineageGia phả nguồn → đích
Phân loại dữ liệuData ClassificationGắn nhãn mức nhạy cảm
Hồ sơ hoạt động xử lýROPASổ ghi các hoạt động xử lý dữ liệu
Chuyển dữ liệu xuyên biên giớiCross-border TransferDữ liệu rời khỏi VN
Mã hóa khi lưu / khi truyềnEncryption at rest / in transitKhóa mã dữ liệu
Ẩn danh / Giả danhAnonymization / PseudonymizationBỏ / thay danh tính
Che hiển thịMaskingChe một phần dữ liệu
Phân quyền theo vai tròRBACCấp quyền theo công việc
Quyền tối thiểuLeast PrivilegeChỉ cấp đúng mức cần
Nhật ký truy cậpAudit Log / TrailGhi ai làm gì
Nơi lưu trú dữ liệuData ResidencyQuốc gia dữ liệu nằm
Máy chủ / Cơ sở dữ liệuServer / DatabaseMáy phục vụ / kho dữ liệu
Điện toán đám mâyCloud (IaaS/PaaS/SaaS)Thuê hạ tầng qua internet
Chất lượng dữ liệuData QualityDữ liệu đúng, đủ, kịp thời
Dữ liệu chủ / tham chiếuMaster / Reference DataDữ liệu lõi dùng chung
Danh mục dữ liệuData CatalogThư viện tra cứu dữ liệu
Từ điển nghiệp vụBusiness GlossaryĐịnh nghĩa thuật ngữ thống nhất
Hệ thống lõi ngân hàngCore BankingPhần mềm trung tâm quản lý tài khoản
Khóa chính / khóa ngoạiPrimary / Foreign KeyMã định danh / liên kết bảng
Rút–biến đổi–nạpETL / ELTDi chuyển & biến đổi dữ liệu
Xử lý theo lô / thời gian thựcBatch / Real-timeGom đợt / xử lý ngay
Tường lửaFirewallLọc lưu lượng mạng
Xác thực đa yếu tốMFA / 2FAMật khẩu + yếu tố thứ hai
Chống thất thoát dữ liệuDLPNgăn dữ liệu nhạy cảm ra ngoài
Lừa đảo qua emailPhishingGiả mạo để lấy thông tin
Mã độc tống tiềnRansomwareMã hóa dữ liệu đòi tiền chuộc
Mối đe dọa nội bộInsider ThreatRủi ro từ nhân viên
Nguyên tắc giới hạn mục đíchPurpose LimitationDùng đúng mục đích đã nêu
Tối thiểu hóa dữ liệuData MinimizationThu đúng mức cần
Căn cứ pháp lýLegal BasisCơ sở được phép xử lý
Sự đồng ýConsentChủ thể tự nguyện cho phép
Chủ thể dữ liệuData SubjectNgười mà dữ liệu nói về
Bên kiểm soát / xử lý dữ liệuController / ProcessorBên quyết định / bên làm thuê
Yêu cầu của chủ thể dữ liệuDSAR / DSRDSAR gốc = quyền truy cập; nghĩa rộng (DSR) = mọi yêu cầu xem/sửa/xóa/phản đối…
Đánh giá tác độngDPIAĐánh giá rủi ro trước khi làm
Hợp đồng xử lý dữ liệuDPARàng buộc đối tác về dữ liệu
Sự cố lộ lọt dữ liệuData BreachDữ liệu bị lộ/mất trái phép
Kho / hồ dữ liệuData Warehouse / LakeNơi gom dữ liệu phân tích
Chỉ số đo lườngKPI / MetricSố đo hiệu quả
Học máy / Dữ liệu huấn luyệnMachine Learning / Training DataMáy học từ dữ liệu
Quyết định tự độngAutomated DecisionHệ thống tự quyết, không có sự can thiệp đáng kể của con người

Tài liệu tham khảo ↑ đầu trang

  • Luật Bảo vệ Dữ liệu Cá nhân (PDPL) — hiệu lực 01/01/2026: văn bản cấp luật, cao nhất và là khung pháp lý nền tảng hiện hành về bảo vệ dữ liệu cá nhân tại Việt Nam. (Tra cứu số hiệu & điều khoản bản gốc để trích dẫn chính xác.)
  • Nghị định 13/2023/NĐ-CP về bảo vệ dữ liệu cá nhân (PDPD) — văn bản dưới luật, nền móng đầu tiên (2023), cụ thể hóa & áp dụng song song theo hướng dẫn hiện hành.
  • DAMA-DMBOK2Data Management Body of Knowledge, 2nd Edition, DAMA International. Khung 11 knowledge areas dùng làm xương sống tài liệu này.
  • Luật An ninh mạng và nghị định hướng dẫn — yêu cầu về an ninh không gian mạng & lưu trữ dữ liệu.
  • Luật An toàn thông tin mạng — bảo vệ thông tin cá nhân trên mạng, phân loại hệ thống thông tin theo cấp độ.
  • Luật Giao dịch điện tử — liên quan eKYC, chữ ký số, dữ liệu điện tử.
  • Khung pháp lý về Trí tuệ nhân tạo (AI) của Việt Nam (2025) — nghĩa vụ khi dùng AI xử lý dữ liệu cá nhân.
  • Các văn bản của Ngân hàng Nhà nước (SBV/NHNN) về an toàn thông tin & bảo mật trong hoạt động ngân hàng (vd Thông tư về an toàn hệ thống thông tin ngân hàng).
  • GDPR (EU General Data Protection Regulation) — tham chiếu quốc tế cho ROPA (Điều 30), DPIA, quyền chủ thể; dùng đối chiếu, không thay luật VN.

Lưu ý: số hiệu, điều khoản & hiệu lực của các văn bản pháp luật thay đổi theo thời gian — luôn tra cứu bản gốc hiện hành trước khi áp dụng.

→ Xem Miễn trừ trách nhiệm & lưu ý sử dụng ở mục riêng.

Đáp án gợi ý bài tập ↑ đầu trang

Đây là gợi ý, không phải đáp án duy nhất đúng. Mục tiêu là kiểm tra cách suy nghĩ của bạn.

Đáp án Module 1
  1. DIKW: (a) Data — số thô; (b) Information — số gắn ngữ cảnh "của KH A"; (c) Knowledge — quy luật hành vi.
  2. 3 lĩnh vực DAMA gần privacy nhất: Data Governance (đặt chính sách, vai trò), Data Security (bảo vệ truy cập), Metadata (biết mình có dữ liệu gì, ở đâu). Vì privacy cần biết "có gì – ai quyết định – bảo vệ thế nào".
  3. Hồ sơ trùng: lỗi chiều Uniqueness (duy nhất). Rủi ro: khi khách yêu cầu xóa, có thể bỏ sót một hồ sơ → vẫn lưu dữ liệu trái phép.
  4. Vai trò mở thẻ: Data Owner = lãnh đạo P. Thẻ; Data Steward = chuyên viên nghiệp vụ thẻ (định nghĩa trường dữ liệu); Data Custodian = IT/DBA vận hành hệ thống core/kho ảnh.
Đáp án Module 2
  1. Ẩn dụ: server = nhà kho luôn mở; database = hệ kệ hồ sơ có đánh số trong kho; application = quầy giao dịch bạn nói chuyện. (Câu trả lời mở.)
  2. AWS Singapore: dữ liệu cá nhân KH Việt Nam nằm ngoài lãnh thổ VN → phát sinh chuyển dữ liệu xuyên biên giới, cần hồ sơ & điều kiện theo pháp luật VN.
  3. 3 cloud nội địa: Viettel Cloud, VNPT Cloud, FPT Cloud (hoặc CMC, VNG, Bizfly). Lý do: data center đặt tại VN → đáp ứng yêu cầu lưu trữ trong nước & quy định ngành ngân hàng.
  4. Mã hóa: at rest bảo vệ dữ liệu khi lưu; in transit bảo vệ khi truyền. File backup bị đánh cắp → encryption at rest bảo vệ (mất file cũng không đọc được).
  5. Mask/ẩn danh khi: mục đích chỉ cần thống kê/báo cáo/kiểm thử, không cần danh tính thật → giảm rủi ro & nghĩa vụ tuân thủ.
  6. eKYC — ITGC/ITAC/ISO: ITGC vd: rà soát quyền truy cập định kỳ + quản lý thay đổi (test & duyệt trước khi lên production). ITAC vd: kiểm tra hợp lệ CCCD khi nhập + masking ảnh/số khi hiển thị (hoặc maker–checker khi xuất dữ liệu). Với cloud nước ngoài: viện dẫn ISO 27001 + 27701/27017/27018; ngoài "có chứng chỉ" phải kiểm phạm vi (scope/SoA) có bao trùm đúng dịch vụ, đòi thêm SOC 1/SOC 2, và nhớ ISO không thay nghĩa vụ PDPL/SBV.
Đáp án Module 3
  1. Email marketing: dựa trên sự đồng ý riêng. Không dùng "thực hiện hợp đồng" vì marketing không cần thiết để thực hiện hợp đồng dịch vụ chính.
  2. 5 cột ROPA tối thiểu: tên hoạt động xử lý; mục đích; loại dữ liệu; căn cứ pháp lý; thời hạn lưu. (Cộng thêm: bên nhận, cross-border, biện pháp bảo vệ.)
  3. Xóa dữ liệu: kiểm tra core banking, CRM, kho ảnh/eKYC, kho dữ liệu/báo cáo, backup, và dữ liệu ở đối tác. Công cụ: data inventory + data mapping + lineage.
  4. Cần DPIA khi: xử lý rủi ro cao — vd (1) chấm điểm tín dụng bằng AI; (2) thu thập sinh trắc học eKYC quy mô lớn.
  5. Gửi nhầm 500 KH: phát hiện & ghi nhận → ngăn chặn (thu hồi/khóa) → đánh giá mức độ → thông báo (cơ quan có thẩm quyền & chủ thể theo thời hạn) → khắc phục → rút kinh nghiệm.
  6. Đối tác cloud nước ngoài: (1) ký DPA ràng buộc bảo mật & xóa dữ liệu; (2) lập hồ sơ chuyển dữ liệu ra nước ngoài (TIA); (3) thẩm định biện pháp bảo vệ & quyền audit.
Đáp án Module 4
  1. Dashboard doanh thu theo KH: Rủi ro: (a) dữ liệu cá nhân nhiều nguồn dồn một chỗ, quá nhiều người xem; (b) dùng sai mục đích/ngoài thẩm quyền. Giảm thiểu: phân quyền theo vai trò (RBAC) + chỉ hiển thị mức tổng hợp/ẩn danh khi không cần danh tính; ghi log truy cập.
  2. AI phát hiện gian lận: (1) Căn cứ pháp lý cho việc dùng dữ liệu giao dịch để huấn luyện là gì? (2) Dữ liệu huấn luyện có được tối thiểu hóa/giả danh không? (3) Đã làm DPIA chưa, mô hình có giải thích được & có cơ chế khiếu nại không?
  3. AI từ chối vay không giải thích: rủi ro "hộp đen" (thiếu minh bạch) + nguy cơ thiên kiến; ảnh hưởng quyền được biết/giải thích và quyền liên quan đến quyết định hoàn toàn tự động của chủ thể.
Đáp án Module 5
  1. Marketing kiêm DPO: Phản đối — vi phạm nguyên tắc tránh xung đột lợi ích: người quyết định mục đích xử lý (Marketing) không thể đồng thời giám sát chính mình. Cũng đe dọa tính độc lập của DPO.
  2. RACI cho "Thông báo cơ quan quản lý": Ban lãnh đạo = A (chịu trách nhiệm cuối); DPO = R (soạn & là đầu mối gửi A05/NHNN); Pháp chế = C (rà pháp lý); IT = C/I (cung cấp dữ liệu kỹ thuật về sự cố). Mỗi hàng đúng 1 'A'.
  3. Tự chấm checklist: (câu trả lời mở) — tick ≥ 6/8 là đạt nền tảng DPO. Hai mục yếu thường gặp ở người business: "đọc SQL" và "hỏi IT về region cloud" — kế hoạch: học lại mục SQL & mục Cloud, thực hành trên dữ liệu giả.

Miễn trừ trách nhiệm ↑ đầu trang

Đọc kỹ trước khi áp dụng vào công việc thật

⚠️ Miễn trừ trách nhiệm

Đây là tài liệu đào tạo do cá nhân tự biên soạn, mang tính tham khảo & học tập — không phải tài liệu nội bộ của bất kỳ tổ chức nàokhông thay thế tư vấn pháp lý chính thức. Mọi ví dụ dùng dữ liệu giả.

Khi áp dụng vào thực tế: không nhập PII/số tài khoản/số thẻ thật vào template; luôn đối chiếu văn bản pháp luật hiện hành; và phối hợp với bộ phận Pháp chế / IT / An ninh thông tin của tổ chức bạn. Tác giả không chịu trách nhiệm cho bất kỳ quyết định nào dựa trên tài liệu này.

🔒 Về quyền riêng tư của trang học này

Đây là một trang web tĩnh (static site), không có backend — không có máy chủ nào xử lý hay lưu trữ dữ liệu của bạn. Trang không thu thập, không gửi dữ liệu cá nhân của bạn về máy chủ (không tracking, không cookie định danh). Tiến độ học (bài đã xem, trắc nghiệm) chỉ lưu cục bộ trên trình duyệt của bạn (localStorage), không đẩy lên đâu cả. Các liên kết ngoài (about / donate / Ko-fi) & mã QR chỉ kích hoạt khi bạn chủ động bấm/quét.