AI Solution Architecture

Docs

View source

Dự Án Thực Hành

Các dự án biến curriculum thành artifact kiến trúc. Mỗi dự án nên tạo diagram, decision log, risk register và verification plan.

Hãy dùng các template trong AI Solution Architecture Toolkit khi làm từng dự án.

Tiến Trình Dự Án

flowchart TB P01[P01 So sánh agent architecture] --> P02[P02 Chọn serving runtime] P02 --> P03[P03 RAG data plane] P03 --> P04[P04 Kế hoạch adaptation và training] P04 --> P05[P05 LLMOps và evaluation layer] P05 --> P06[P06 Capstone production AI platform]

P01: So Sánh Agent Architecture

Thiết kế cùng một use case assistant trên OpenAI Agents Python, LangChain/LangGraph, AutoGen và LlamaIndex.

Deliverable:

Quyết định chính: sản phẩm nên dựa chủ yếu trên agent loop, workflow graph, multi-agent team, retrieval engine hay hybrid.

P02: Chọn Serving Runtime

Thiết kế serving layer cho ứng dụng đã chọn. So sánh Transformers, vLLM, llama.cpp và UI gateway như Open WebUI.

Deliverable:

Quyết định chính: chọn runtime khớp với deployment environment và traffic pattern.

P03: RAG Data Plane

Thiết kế retrieval bằng Qdrant hoặc Chroma. Định nghĩa ingestion, chunking, embedding versioning, collection layout, metadata filter, deletion/update semantics và query routing.

Deliverable:

Quyết định chính: chọn vector store và operating mode phù hợp với durability, scale, developer velocity và governance.

P04: Kế Hoạch Adaptation Và Training

Quyết định sản phẩm có cần training không. So sánh prompting, retrieval, PEFT adapter và DeepSpeed distributed training.

Deliverable:

Quyết định chính: khoảng cách chất lượng đến từ data, orchestration, retrieval, adapter tuning hay full training.

P05: LLMOps Và Evaluation Layer

Thiết kế tracing, scoring, feedback, dataset, experiment lineage và promotion gate bằng Langfuse, Phoenix, MLflow và TruLens.

Deliverable:

Quyết định chính: định nghĩa bằng chứng nào cần có trước khi nói hệ thống tốt hơn.

P06: Capstone Production AI Platform

Thiết kế một giải pháp AI end-to-end dùng cả sáu lớp. Capstone khuyến nghị là Enterprise Knowledge Copilot for Architecture Review, vì bài này buộc bạn xử lý retrieval, tool governance, evaluation, traceability và production readiness trong cùng một bối cảnh.

flowchart LR UI[User interface / Open WebUI hoặc app] --> Agent[Agent hoặc workflow layer] Agent --> MCP[MCP tools và internal APIs] Agent --> RAG[RAG engine] Agent --> Runtime[Model serving runtime] RAG --> VectorDB[Qdrant hoặc Chroma] Runtime --> Model[Base model + adapter] PEFT[PEFT / DeepSpeed training plan] --> Model Agent --> Obs[Langfuse / Phoenix / TruLens traces] Runtime --> Obs Obs --> MLflow[MLflow lineage và registry] Obs --> Gate[Promotion gate] Gate --> Release[Production release]

Deliverable:

Rubric Review

Khu vựcTiêu chí đạt
LayeringMỗi layer có owner và boundary rõ.
RuntimeServing choice khớp capacity, latency, memory và deployment constraint.
DataRAG data contract có versioning, tenancy, deletion và access policy.
EvaluationQuality được đo bằng dataset, trace, score và promotion gate.
SecurityTool execution, secret, auth, data access và audit logging rõ ràng.
OperationsHealth check, incident, rollback, cost và ownership được định nghĩa.
EvidenceMỗi claim kiến trúc link được tới deep dive repo hoặc design artifact.