Skip to content

Bản đồ AI Engineering Stack

Trang này là bản đồ tư duy cho toàn bộ guide. Ý chính rất đơn giản: nhiều công cụ AI trông giống nhau vì đều có planning, execution, review và iteration. Chúng khác nhau vì hoạt động ở các layer khác nhau trong AI engineering stack.

Các framework có vẻ giống nhau vì đều có plan, implement, review, iterate. Chúng khác nhau vì mỗi framework sở hữu một layer khác nhau trong stack.

Nếu so sánh sai layer, mọi thứ sẽ mơ hồ. LangGraph, Hermes, AWS AI-DLC, Spec Kit và MCP đều có thể xuất hiện trong một hệ thống agentic, nhưng chúng không giải quyết cùng một vấn đề.

Stack tổng thể

mermaid
flowchart TB
    A[Business intent và product risk] --> B[Workflow và methodology]
    B --> C[Agent harness hoặc coding runtime]
    C --> D[Agent app framework]
    D --> E[Tools và protocols]
    D --> F[Data, RAG, retrieval]
    E --> G[Model/provider/serving]
    F --> G
    H[Evals và observability] -. cross-cutting .-> B
    H -. cross-cutting .-> C
    H -. cross-cutting .-> D
    I[Security và governance] -. cross-cutting .-> B
    I -. cross-cutting .-> C
    I -. cross-cutting .-> D
    I -. cross-cutting .-> E

Bản đồ các layer

LayerVí dụCâu hỏi chínhOutput
Workflow/methodologySpec Kit, OpenSpec, AWS AI-DLC, GSD, SuperpowersHuman và agent nên delivery software như thế nào?Specs, plans, approvals, tests, reviews
Agent harness/runtimeCodex CLI, Claude Code, HermesAgent chạy với tools, memory, filesystem và subagents như thế nào?Tool calls, code changes, terminal actions
Agent app frameworkLangChain, LangGraph, LlamaIndex, Semantic KernelLàm sao build AI application hoặc long-running agent service?Chains, graphs, agents, state machines
Tool/protocol layerMCP, OpenAPI tools, function calling, tool gatewaysModel được phép làm gì một cách an toàn?Tool schemas, policies, audit events
Data/RAG layerEmbeddings, vector DBs, retrievers, rerankersAI dùng tri thức nào?Indexed content, retrieved context, citations
Model/serving layerOpenAI, Anthropic, local LLMs, vLLM, Ollama, LiteLLMModel nào chạy inference và chạy như thế nào?Responses, tool calls, token/cost/latency profile
Evals/observabilityLangSmith, Langfuse, Phoenix, OpenTelemetryLàm sao biết hệ thống vẫn chạy đúng?Traces, eval scores, regression results
Security/governanceRBAC, sandboxing, audit logs, approval gatesĐiều gì được phép, được review và ai chịu trách nhiệm?Policies, logs, approvals, risk records

Vì sao dễ bị rối

Các layer khác nhau dùng lại cùng một nhóm động từ:

Động từTrong workflow frameworksTrong app frameworksTrong harnesses
PlanPlan feature hoặc delivery unitPlan execution path của agentPlan terminal/file actions
ImplementSinh code từ specs/tasksChạy node/chain/tool pathSửa file và chạy command
ReviewReview spec, design, code, evidenceEvaluate outputs và tracesKiểm tra diff, tests, logs
IterateĐổi artifacts và implementationCải thiện prompts, tools, graphsRetry task với context tốt hơn

Động từ giống nhau. Quyền sở hữu khác nhau.

Vì vậy, chỉ nhìn thấy plan -> implement -> review là chưa đủ để phân loại framework. Cần hỏi framework đó sở hữu artifact nào, kiểm soát rủi ro nào và ai chịu trách nhiệm cuối cùng.

Cách đọc guide này

  1. Dùng trang này để xác định layer bạn đang giải quyết.
  2. Đọc deep-dive pages để hiểu từng framework.
  3. Dùng comparison pages để chọn workflow mặc định.
  4. Dùng reference architectures để kết hợp các layer an toàn.

Quy tắc chọn nhanh nhất

Vấn đềBắt đầu ở đây
Requirement còn mơ hồSpec Kit hoặc OpenSpec
Enterprise delivery cần audit và approvalAWS AI-DLC
Project dài bị mất contextGSD
Agent code thiếu kỷ luật engineeringSuperpowers
Cần open/custom agent harnessHermes
Build RAG hoặc tool-calling AI appLangChain
Build stateful long-running agent appLangGraph
Cần production assuranceEvals, observability, security, governance

Ví dụ thực tế

Với một production support agent, các layer có thể như sau:

mermaid
flowchart TB
    A[AWS AI-DLC] --> B[Delivery governance và approval]
    C[OpenSpec] --> D[Change proposal cho một agent capability]
    E[LangGraph] --> F[Stateful support-agent runtime]
    G[MCP/tool gateway] --> H[CRM, ticketing, knowledge-base tools]
    I[RAG layer] --> J[Policy và product documentation]
    K[Model router] --> L[Hosted và local models]
    M[LangSmith/Langfuse/Phoenix] --> N[Traces và evals]
    O[Security controls] --> P[Tool approval, audit, memory retention]

Không có một framework duy nhất sở hữu toàn bộ stack đó. Một team trưởng thành sẽ kết hợp ít layer nhất có thể, nhưng ranh giới trách nhiệm phải rõ.

References

Built as a static bilingual AI engineering stack guide.