Docs

Bài Kiểm Tra Kiến Trúc

Thời lượng: 90 phút

Bối cảnh: Bạn đang thiết kế một Enterprise Knowledge Copilot hỗ trợ review kiến trúc. Hệ thống phải trả lời có citation từ tài liệu nội bộ, hỗ trợ tool call đã được phê duyệt, trace toàn bộ interaction và tạo production readiness summary.

Phần 1: Layering

Vẽ sáu lớp chính của hệ thống và nêu trách nhiệm của từng lớp.
Giải thích vì sao model runtime không nên sở hữu retrieval policy.
Giải thích vì sao agent/workflow layer không nên sở hữu long-term experiment lineage.

Phần 2: Quyết Định Runtime

Bạn có ba lựa chọn serving: hosted API, vLLM và llama.cpp.

Tạo decision matrix với ít nhất sáu tiêu chí.
Chọn một runtime cho bản production đầu tiên và giải thích.
Định nghĩa metric nào sẽ buộc team đổi runtime.

Phần 3: RAG Data Contract

Định nghĩa các field bắt buộc cho document, chunk, metadata và query.
Giải thích access control nên được enforce ở đâu.
Định nghĩa retrieval evaluation plan.

Phần 4: LLMOps Và Evaluation

Định nghĩa trace schema.
Định nghĩa promotion gate cho prompt, retrieval và model change.
Giải thích lineage kiểu MLflow khác gì observability trace của LLM.

Phần 5: Security Và Governance

Chỉ ra năm rủi ro bảo mật riêng của copilot này.
Định nghĩa tool governance policy.
Định nghĩa những gì phải log để audit được.

Phần 6: Production Readiness

Tạo release checklist.
Định nghĩa rollback behavior.
Định nghĩa ba kịch bản failure rehearsal.

Rubric

Khu vực	Điểm
Layering và boundary	15
Chất lượng quyết định runtime	15
RAG data contract	15
Evaluation và LLMOps	20
Security và governance	20
Production readiness	15