Runtime精读笔记
本页汇总「Runtime」主题下的 28 篇精读卡,适合按编号顺序阅读,也可以通过左侧搜索直达具体主题。
AI Agent技术0-1拆解AI Agent技术0 1拆解 [同步引用内容已省略] 基础,Agent技术 <table <colgroup <col/ <col/ </colgroup <tbody <tr ...
AI Harness 工程:Agent 能跑起来的那一层到底是什么?AI Harness 工程:Agent 能跑起来的那一层到底是什么? 关于构建 AI Agent,业界通常谈的是三种架构路径:SDK、Frameworks、Scaffolding。...
AI 网关AI 网关 [图示已省略] AI 网关 AI 网关是 AI 应用时代的“交通枢纽”,重塑智能服务的连接、治理与创新边界。 AI 网关是 AI 原生应用体系中的入口控制平面。它位于模...
Claude Harness Engineering 操作手册Claude Harness Engineering 操作手册 这份文档不是传统 SOP 这份文档有严格的适用边界。它不是一个固定流程,而是一份带时间戳的、个人视角的阶段性认识。原...
Harness Engineering 深度解析Harness Engineering 深度解析 第一部分:什么是 Harness Engineering 1.1 三层工程概念的关系 Harness Engineering 并不...
Harness Engineering:同一个模型,从42%到78%——Vibe Coding时代真正的护城河Harness Engineering:同一个模型,从42%到78%——Vibe Coding时代真正的护城河 同一个模型,Claude Opus 4.5,在CORE Bench(...
Harness is the New Dataset:模型智能提升的下一个关键方向Harness is the New Dataset:模型智能提升的下一个关键方向 01.为什么 Harness Engineering 开始变得重要? 从时间线看,AI 工程方法...
Harness到底是什么?一篇给你讲透Harness到底是什么?一篇给你讲透 一、为什么Harness突然火了 这个词在2025年末到2026年初明显升温。 Anthropic在2025年11月就已经公开讨论“long...
Harness驱动的AgentHarness驱动的Agent 核心结论 Harness,别光想成是个新模型或者更厉害的提示词,就是把那些:模型+工具+状态+验收+日志+恢复啥的,统统整合起来,让Agent成真·...
RAG可观测性RAG可观测性 [图示已省略] 真正可用的 RAG 系统,必须能“看见”每个环节的语义质量和性能瓶颈,否则优化无从下手。 RAG 系统(RAG, Retrieval Augment...
为什么智能体需要运行时为什么智能体需要运行时 为什么智能体需要运行时:从 Class 到 Execution Domain 的转变 提示 智能体的本质是行为系统,而非代码片段。只有将其从 class 提...
可观测性可观测性 AI 基础设施的可观测性 AI 可观测性让工程师重新获得对智能系统的解释权,打破“黑箱”,实现全链路治理。 提示 AI 系统的行为并非由固定逻辑驱动,而是由大型模型、检索...
失败模式与边界条件失败模式与边界条件 [图示已省略] 智能体的工程化失败模式与边界条件 提示 智能体(Agent)真正的工程挑战,不在于模型能力,而在于系统抽象与运行时治理。只有理解失败模式,才能构...
开源生态开源生态 提示 开源生态决定了大模型工程化的底座和未来演进方向,是每个云原生工程师必须关注的技术基石。 大模型开源生态简介 开源社区是整个大模型工程体系的“发动机”。它不仅输出模型...
我的Harness Engineering实践我的Harness Engineering实践 所谓Harness Engineering,是通过强制性的工程约束和标准化的输入输出,将 AI 的不可预测性,收敛为确定性的交付。 ...
推理系统推理系统 提示 推理系统不是“谁更快”的问题,而是“分工协作、各司其职”。理解三层架构,才能选对工具。 大模型推理的三层架构 大语言模型(LLM, Large Language M...
智能体作为 Workload智能体作为 Workload 智能体作为 Workload:从代码实体到可治理执行单元 提示 只有将智能体建模为可调度的 Workload,才能真正纳入云原生治理,实现安全、可观测...
智能体框架(Harness)到底是什么?智能体框架(Harness)到底是什么? 智能体 = 模型 + 框架 如果你不是模型,你就是框架。这个公式听起来简单,但真正理解它需要费点功夫。 具体来说,框架里包含这些东西:系统...
概览概览 [图示已省略] 智能体运行时概览:AI 原生时代的执行层抽象 提示 智能体运行时(Agentic Runtime)正在重塑 AI 应用的执行层,让 Agent 从代码里的 c...
概述概述 LangChain 1.0 简介 提示 LangChain 1.0 以统一接口、强大流程编排和丰富工具集成,成为构建 AI 智能体应用的一站式框架。本文梳理其发展脉络与核心能...
模型不是关键,Harness 才是模型不是关键,Harness 才是 同一个模型,换一套运行环境,编程基准的成功率就从 42% 跳到了 78%。 这个数据来自 Nate B Jones 的一项研究,只有一个变量:模...
模型越来越强,为什么大家却开始重写 Harness模型越来越强,为什么大家却开始重写 Harness Harness这个词真正有意思的地方在于,它提醒我们:AI 工程的重心,正在从“让模型更会回答”,转向“让系统更稳地交付结果”。...
第七章:GPU高性能编程第七章:GPU高性能编程 7.1 回顾GPU架构与执行模型 7.1.1 GPU硬件架构(以A100/H100为例) 以A100或H100为例,GPU包含大量流式多处理器(SM),每...
第九章:后台任务和周期检查第九章:后台任务和周期检查 Automations 是什么 Automations 是让 Codex 在后台或按计划执行重复任务的能力。 提示 适合: 每天检查测试是否失败。 每周...
运行态模型运行态模型 [图示已省略] Agent Execution Context:智能体运行态模型 提示 智能体的“运行时上下文”决定了其能否成为真正可调度、可持续演进的自治系统核心。 ...
运行时成本模型运行时成本模型 智能体运行时的成本模型:Token、KV Cache、GPU 与工具调用 提示 智能体运行时的成本结构远超传统云原生模型,只有理解推理、状态与工具链的乘积关系,才能...
长时自主Agent,先解决这8个Harness核心问题长时自主Agent,先解决这8个Harness核心问题 本质上,所有 Harness 设计都是在对抗两类问题:agent 要么开始偷懒、走捷径,要么开始迷糊、犯蠢。有些问题比另一些...
高效Agents的尽头是,Harness高效Agents的尽头是,Harness 模型 是CPU:提供原始处理能力 上下文窗口 是RAM:有限的、易失性工作内存 Agent Harness 是操作系统:管理上下文,处理"...