定义:基于 Transformer 架构,通过海量文本数据训练的大规模语言模型,具备理解和生成人类语言的能力。
类比:AI 系统的 “大脑内核”,提供基础的语言理解、推理和生成能力。
代表:GPT-4、Claude 3、通义千问、混元大模型等。
定义:人类与 LLM 沟通的指令载体,以自然语言形式传递需求、背景和要求,引导模型输出符合预期的结果。
类比:给 AI 助手的 “命令”,单次指令触发特定响应。
进阶:提示工程 (Prompt Engineering) 通过优化指令格式提升模型表现。
定义:将信息检索与文本生成相结合的技术框架,在 LLM 回答前先从外部知识库检索相关信息,作为上下文注入模型,提升回答准确性和时效性。
类比:LLM 的 “外挂资料库”,解决知识截止和幻觉问题。
流程:用户查询→关键词提取→向量数据库检索→相关文档→上下文注入→LLM 生成答案。
定义:Anthropic 于 2024 年推出的开放协议,标准化 LLM 与外部数据源、工具的通信,实现安全高效的连接。
类比:AI 系统的 “USB-C 接口”,统一不同工具和数据的接入方式。
核心价值:打破数据孤岛,让 AI 安全调用本地文件、数据库、API 等外部资源。
定义:能够感知环境、自主决策并执行行动以实现特定目标的 AI 实体,整合 LLM、RAG、MCP 等技术能力。
类比:“全能数字员工”,可自主拆解任务、制定计划、调用工具完成复杂目标。
核心能力:任务规划、工具调用、记忆管理、结果反思迭代。
定义:为 Agent 提供的标准化、可复用、可扩展的能力集合,封装了特定任务的执行方法、工具调用逻辑和知识材料。
类比:Agent 的 “手脚” 和 “经验库”,如 PDF 处理 Skill、代码生成 Skill 等。
形式:通常包含 SKILL.md 文件,组织指令、脚本和参考资料。
定义:约束 Agent 行为的规范体系,包括业务规则、安全规范、编码标准等,确保 Agent 输出符合预期和合规要求。
类比:Agent 的 “行为准则”,如代码规范 Rule、数据访问权限 Rule 等。
| 工具名称 | 核心定位 | 特色功能 | 典型场景 |
| dify | 开源 LLM 应用开发平台 | 可视化 Prompt 编排、内置 RAG 引擎、Agent 工作流设计、多模型兼容、MCP 协议支持 | 快速构建 AI 应用、企业级 RAG 系统、智能体开发 |
| ollama | 本地 LLM 运行工具 | 一键运行主流开源模型 (Llama 3、Phi-3 等)、自动管理依赖、支持模型量化、保障数据隐私 | 离线环境 AI 助手、隐私敏感数据分析、本地模型测试 |
| open-webui | 本地 LLM 可视化前端 | 友好聊天界面、多模型管理、自定义提示词模板、API 集成 | 本地模型可视化交互、团队共享 LLM 访问 |
| LangChain | LLM 应用开发框架 | 链式调用、提示词管理、文档加载器、向量存储集成、Agent 开发工具 | 复杂 AI 应用开发、自定义 RAG 系统、多工具协同 Agent |
| OpenClaw | 个人电脑 AI 代理 | 自主任务执行、MCP 协议集成、Skill 插件生态、本地设备控制 | 个人数字助理、文件管理、日程安排、自动化办公 |
| 工具名称 | 开发者 | 核心定位 | 特色功能 |
| 阿里 Qoder | 阿里巴巴 | Agentic 编程平台 | Quest Mode 任务委托、多模型动态调度、代码检索引擎、长短期记忆系统 |
| 华为 CodeArts Doer | 华为 | 全流程 AI 编程助手 | 6 大专业 Agent (团队、产品、开发等)、分级记忆机制、探索 / 规范双模式 |
| 腾讯 CodeBuddy IDE | 腾讯 | 全栈协作 AI IDE | Craft 智能体、自然语言转 PRD、设计稿转代码、混元 + DeepSeek 双模型 |
| 字节跳动 Trae | 字节跳动 | AI 原生 IDE | SOLO Builder/Coder 双模式、Trae Rules 引擎、MCP 协议集成、自定义智能体 |
| Cursor | Anysphere | AI 驱动代码编辑器 | GPT-4/Claude 3.5 双引擎、全工程上下文感知、自然语言编程、跨文件重构 |
定义:阿里云基于通义大模型的智能编码辅助工具,支持 VS Code、IntelliJ IDEA 等主流 IDE。
核心功能:
代码智能生成:行级 / 函数级实时续写、自然语言转代码。
研发智能问答:代码解释、注释生成、异常排查。
编程智能体:自主任务拆解、工程检索、文件编辑、终端执行。
MCP 工具使用:连接外部资源,拓展能力边界。
定位:提升编码效率,降低理解和编写代码的难度。
上述概念共同构成了现代 AI 应用的技术栈,从基础模型到交互方式,再到能力扩展和应用落地,形成完整闭环。随着技术演进,这些概念的边界逐渐融合:
Agent 正从单一任务执行向多 Agent 协同发展,如华为 CodeArts Doer 的 6 大专业 Agent 分工协作。
Skill 生态日益丰富,成为 AI 能力复用和共享的重要形式,如 OpenClaw 支持自定义和共享 Skill。
MCP 协议推动 AI 与企业系统的无缝集成,成为 AI 原生应用的基础设施。
拓展方向:
多模态能力:LLM 与图像、语音等模态融合,如 Trae 支持截图解析生成代码。
企业级应用:RAG 结合私域知识库,MCP 连接企业系统,打造专属 AI 助手。
低代码 / 无代码:dify 等平台降低 AI 应用开发门槛,让非技术人员也能构建 AI 解决方案。