Docs
View sourceBài Kiểm Tra Kiến Trúc
Thời lượng: 90 phút
Bối cảnh: Bạn đang thiết kế một Enterprise Knowledge Copilot hỗ trợ review kiến trúc. Hệ thống phải trả lời có citation từ tài liệu nội bộ, hỗ trợ tool call đã được phê duyệt, trace toàn bộ interaction và tạo production readiness summary.
Phần 1: Layering
- Vẽ sáu lớp chính của hệ thống và nêu trách nhiệm của từng lớp.
- Giải thích vì sao model runtime không nên sở hữu retrieval policy.
- Giải thích vì sao agent/workflow layer không nên sở hữu long-term experiment lineage.
Phần 2: Quyết Định Runtime
Bạn có ba lựa chọn serving: hosted API, vLLM và llama.cpp.
- Tạo decision matrix với ít nhất sáu tiêu chí.
- Chọn một runtime cho bản production đầu tiên và giải thích.
- Định nghĩa metric nào sẽ buộc team đổi runtime.
Phần 3: RAG Data Contract
- Định nghĩa các field bắt buộc cho document, chunk, metadata và query.
- Giải thích access control nên được enforce ở đâu.
- Định nghĩa retrieval evaluation plan.
Phần 4: LLMOps Và Evaluation
- Định nghĩa trace schema.
- Định nghĩa promotion gate cho prompt, retrieval và model change.
- Giải thích lineage kiểu MLflow khác gì observability trace của LLM.
Phần 5: Security Và Governance
- Chỉ ra năm rủi ro bảo mật riêng của copilot này.
- Định nghĩa tool governance policy.
- Định nghĩa những gì phải log để audit được.
Phần 6: Production Readiness
- Tạo release checklist.
- Định nghĩa rollback behavior.
- Định nghĩa ba kịch bản failure rehearsal.
Rubric
| Khu vực | Điểm |
|---|---|
| Layering và boundary | 15 |
| Chất lượng quyết định runtime | 15 |
| RAG data contract | 15 |
| Evaluation và LLMOps | 20 |
| Security và governance | 20 |
| Production readiness | 15 |