AI Solution Architecture

Docs

View source

Bảng Thuật Ngữ

Glossary này chuẩn hóa từ vựng giữa agent framework, serving runtime, vector database, training library và LLMOps tool.

Thuật ngữÝ nghĩa
AgentThực thể runtime chọn hành động, gọi tool, quản lý context và tạo output.
Agent loopChu trình lặp observe, plan, act, kiểm tra kết quả, rồi tiếp tục hoặc dừng.
Workflow graphLuồng node/edge có cấu trúc, thường deterministic hơn agent loop.
ToolCapability callable được expose cho model hoặc agent, thường có schema và side effect.
HandoffChuyển quyền điều khiển từ agent hoặc vai trò này sang agent/vai trò khác.
GuardrailLớp policy hoặc validation để block, route hoặc sửa hành vi không an toàn/không hợp lệ.
MemoryState ở mức session hoặc persistent được agent/application dùng.
RAGRetrieval-augmented generation: retrieve context ngoài trước hoặc trong lúc generate.
EmbeddingVector biểu diễn text, image hoặc dữ liệu khác để similarity search.
ChunkĐoạn tài liệu được index cho retrieval.
Vector databaseHệ thống lưu trữ và query embedding kèm metadata.
Hybrid searchRetrieval kết hợp vector similarity với lexical hoặc structured filtering.
Payload / metadataTrường không phải vector dùng cho filtering, tenancy, access control hoặc ranking.
Inference runtimePhần mềm nạp model và thực thi generation/prediction.
Token streamingTrả token sinh ra theo từng phần về caller.
KV cacheCache attention key/value để tăng tốc autoregressive decoding.
QuantizationGiảm độ chính xác số của model để tiết kiệm memory hoặc tăng tốc.
AdapterModule trainable nhỏ gắn vào base model để adaptation theo task/domain.
PEFTParameter-efficient fine-tuning, gồm các phương pháp adapter kiểu LoRA.
ZeRONhóm tối ưu DeepSpeed chia optimizer, gradient và parameter.
CheckpointModel/training state được lưu để recovery hoặc deployment.
TraceBản ghi có cấu trúc của interaction AI, gồm span cho model call, tool, retrieval và score.
SpanMột operation có thời lượng trong trace.
Evaluation datasetBộ example dùng để đo chất lượng hoặc regression.
Feedback functionHàm scoring đo các thuộc tính như groundedness hoặc relevance.
LineageChuỗi provenance nối dataset, prompt, model, adapter, retrieval config, run và deployment.
MCPModel Context Protocol, giao diện chuẩn kết nối model/agent với tool và resource.
GatewayLớp route request tới provider, tool, model hoặc policy.
Production readinessBằng chứng rằng hệ thống đủ an toàn, observable, governable, scalable và recoverable để vận hành.

Từ Vựng Theo Layer

mindmap root((Từ vựng)) Agent layer Agent loop Tool Handoff Guardrail Memory Serving layer Runtime Tokenizer Streaming KV cache Quantization Data layer RAG Embedding Chunk Metadata Hybrid search Training layer Adapter PEFT ZeRO Checkpoint LLMOps layer Trace Span Score Dataset Lineage Platform layer MCP Gateway Policy Audit log

Các Cặp Thuật Ngữ Hay Bị Nhầm

CặpKhác biệt
Agent vs workflowAgent chọn hành động động; workflow encode control flow rõ hơn.
RAG vs fine-tuningRAG đổi context ở runtime; fine-tuning đổi hành vi model bằng training.
Trace vs logTrace giữ quan hệ nhân quả có cấu trúc qua các span; log thường là event stream.
Evaluation vs monitoringEvaluation đo quality theo example/criteria; monitoring theo dõi health và drift ở runtime.
Adapter vs checkpointAdapter là module học nhỏ; checkpoint có thể chứa toàn bộ model/training state.
Vector search vs hybrid searchVector search dùng embedding similarity; hybrid search trộn vector, lexical và structured signal.
Tool server vs gatewayTool server expose action/resource; gateway route và govern access tới model/tool/provider.