Runtime精读笔记

本页汇总「Runtime」主题下的 28 篇精读卡，适合按编号顺序阅读，也可以通过左侧搜索直达具体主题。

AI Agent技术0-1拆解AI Agent技术0 1拆解 [同步引用内容已省略] 基础，Agent技术 <table <colgroup <col/ <col/ </colgroup <tbody <tr ... AI Harness 工程：Agent 能跑起来的那一层到底是什么？AI Harness 工程：Agent 能跑起来的那一层到底是什么？关于构建 AI Agent，业界通常谈的是三种架构路径：SDK、Frameworks、Scaffolding。... AI 网关AI 网关 [图示已省略] AI 网关 AI 网关是 AI 应用时代的“交通枢纽”，重塑智能服务的连接、治理与创新边界。 AI 网关是 AI 原生应用体系中的入口控制平面。它位于模... Claude Harness Engineering 操作手册Claude Harness Engineering 操作手册这份文档不是传统 SOP 这份文档有严格的适用边界。它不是一个固定流程，而是一份带时间戳的、个人视角的阶段性认识。原... Harness Engineering 深度解析Harness Engineering 深度解析第一部分：什么是 Harness Engineering 1.1 三层工程概念的关系 Harness Engineering 并不... Harness Engineering：同一个模型，从42%到78%——Vibe Coding时代真正的护城河Harness Engineering：同一个模型，从42%到78%——Vibe Coding时代真正的护城河同一个模型，Claude Opus 4.5，在CORE Bench（... Harness is the New Dataset：模型智能提升的下一个关键方向Harness is the New Dataset：模型智能提升的下一个关键方向 01.为什么 Harness Engineering 开始变得重要？从时间线看，AI 工程方法... Harness到底是什么？一篇给你讲透Harness到底是什么？一篇给你讲透一、为什么Harness突然火了这个词在2025年末到2026年初明显升温。 Anthropic在2025年11月就已经公开讨论“long... Harness驱动的AgentHarness驱动的Agent 核心结论 Harness，别光想成是个新模型或者更厉害的提示词，就是把那些：模型+工具+状态+验收+日志+恢复啥的，统统整合起来，让Agent成真·... RAG可观测性RAG可观测性 [图示已省略] 真正可用的 RAG 系统，必须能“看见”每个环节的语义质量和性能瓶颈，否则优化无从下手。 RAG 系统（RAG, Retrieval Augment... 为什么智能体需要运行时为什么智能体需要运行时为什么智能体需要运行时：从 Class 到 Execution Domain 的转变提示智能体的本质是行为系统，而非代码片段。只有将其从 class 提... 可观测性可观测性 AI 基础设施的可观测性 AI 可观测性让工程师重新获得对智能系统的解释权，打破“黑箱”，实现全链路治理。提示 AI 系统的行为并非由固定逻辑驱动，而是由大型模型、检索... 失败模式与边界条件失败模式与边界条件 [图示已省略] 智能体的工程化失败模式与边界条件提示智能体（Agent）真正的工程挑战，不在于模型能力，而在于系统抽象与运行时治理。只有理解失败模式，才能构... 开源生态开源生态提示开源生态决定了大模型工程化的底座和未来演进方向，是每个云原生工程师必须关注的技术基石。大模型开源生态简介开源社区是整个大模型工程体系的“发动机”。它不仅输出模型... 我的Harness Engineering实践我的Harness Engineering实践所谓Harness Engineering，是通过强制性的工程约束和标准化的输入输出，将 AI 的不可预测性，收敛为确定性的交付。 ... 推理系统推理系统提示推理系统不是“谁更快”的问题，而是“分工协作、各司其职”。理解三层架构，才能选对工具。大模型推理的三层架构大语言模型（LLM, Large Language M... 智能体作为 Workload智能体作为 Workload 智能体作为 Workload：从代码实体到可治理执行单元提示只有将智能体建模为可调度的 Workload，才能真正纳入云原生治理，实现安全、可观测... 智能体框架（Harness）到底是什么？智能体框架（Harness）到底是什么？智能体 = 模型 + 框架如果你不是模型，你就是框架。这个公式听起来简单，但真正理解它需要费点功夫。具体来说，框架里包含这些东西：系统... 概览概览 [图示已省略] 智能体运行时概览：AI 原生时代的执行层抽象提示智能体运行时（Agentic Runtime）正在重塑 AI 应用的执行层，让 Agent 从代码里的 c... 概述概述 LangChain 1.0 简介提示 LangChain 1.0 以统一接口、强大流程编排和丰富工具集成，成为构建 AI 智能体应用的一站式框架。本文梳理其发展脉络与核心能... 模型不是关键，Harness 才是模型不是关键，Harness 才是同一个模型，换一套运行环境，编程基准的成功率就从 42% 跳到了 78%。这个数据来自 Nate B Jones 的一项研究，只有一个变量：模... 模型越来越强，为什么大家却开始重写 Harness模型越来越强，为什么大家却开始重写 Harness Harness这个词真正有意思的地方在于，它提醒我们：AI 工程的重心，正在从“让模型更会回答”，转向“让系统更稳地交付结果”。... 第七章：GPU高性能编程第七章：GPU高性能编程 7.1 回顾GPU架构与执行模型 7.1.1 GPU硬件架构（以A100/H100为例）以A100或H100为例，GPU包含大量流式多处理器（SM），每... 第九章：后台任务和周期检查第九章：后台任务和周期检查 Automations 是什么 Automations 是让 Codex 在后台或按计划执行重复任务的能力。提示适合：每天检查测试是否失败。每周... 运行态模型运行态模型 [图示已省略] Agent Execution Context：智能体运行态模型提示智能体的“运行时上下文”决定了其能否成为真正可调度、可持续演进的自治系统核心。 ... 运行时成本模型运行时成本模型智能体运行时的成本模型：Token、KV Cache、GPU 与工具调用提示智能体运行时的成本结构远超传统云原生模型，只有理解推理、状态与工具链的乘积关系，才能... 长时自主Agent，先解决这8个Harness核心问题长时自主Agent，先解决这8个Harness核心问题本质上，所有 Harness 设计都是在对抗两类问题：agent 要么开始偷懒、走捷径，要么开始迷糊、犯蠢。有些问题比另一些... 高效Agents的尽头是，Harness高效Agents的尽头是，Harness 模型是CPU：提供原始处理能力上下文窗口是RAM：有限的、易失性工作内存 Agent Harness 是操作系统：管理上下文，处理"...