世界杯官网线上平台 若何构建很是99%东谈主的Harness Engineer

自2026岁首以来,对于AI编码的商讨逐步发生变化。
以前的要点是使用哪个模子、编写什么教唆词以及高下文不错多长。天然,这些事情仍然很进攻。
但是,从主要参与者的实践中不错明晰地看出,仅靠这些无法处分持久、高质料和合手续运行的问题。
大略六个月前,我仅使用Claude.md运行一个神色。
如若你写下编码商定、目次结构和时期栈,AI频繁会按预期职责。至少在一启动是这么。
问题在神色变大后启动出现。
质料各异:即使使用换取的指示"添加API端点",文献摒弃和造作处理细节也可能因会话而异。
会话断开:当你要求他们不时昨天的职责时,你得到的罢了忽略了以前的设想决策。
技巧添加失败:在添加了20多个技巧(如/write-test)后,经管扩张章程和先决条目变得难以经管。
换句话说,Claude的markdown只不外是一个"恳求"。
莫得机制来检测违法。
莫得机制来提神划定何时变得逾期。
如若你请托给他们一个持久任务,一个造作意味着他们将不得不重新启动。
这里的问题不单是是教唆词的编写方式。
本体上,这源于AI智能体运行的环境莫得被正确设想这一事实。
因此,自2026岁首以来引起海涵的一个见地是Harness Engineering。
Harness Engineering是什么?
什么是harness?
Harness是一匹随即穿着的"马具",由缰绳、马鞍和笼头构成——一套好意思满的用具,用于领导一匹雄伟但不成瞻望的动物朝着正确的方上前进。
Harness Engineering是什么?
Harness Engineering是对于设想允许AI智能体褂讪、自主运行的"环境本人"。
就像你用马具灭亡马一样,念念法是灭亡AI并领导它朝着正确的方上前进!
• AI模子就像马。它们很雄伟,但不知谈我方要去那处。
• Harness是一套缰绳、马鞍和笼头。它代表领导AI朝着正确方上前进的环境、敛迹和用具的总数。
笔据Michael Hashimoto的说法,磋磨是"创建一个谨防AI智能体失败再次发生的环境"。
我不知谈咫尺是否有平庸的行业公认术语,但我依然启动称之为"Harness Engineering"。它的理念是,每当你发现智能体犯错时,你花时辰设想一个处分决策,使智能体始终不会再犯相通的造作。
进化的真正体验:
AI智能体灭亡依然经验了三个阶段。
咱们将回归每个阶段变得可能的事情和衰败的东西。
第一阶段:CLAUDE.md时间(教唆词工程,2023岁首)
在神色根目次摒弃一个CLAUDE.md文献,并在其中写入你的时期栈和编码商定。仅此一项就权贵改善了AI的输出。
CLAUDE.md
时期栈
• Next.js 15(App Router)
• TypeScript 5.x
• Prisma + PostgreSQL
商定
• 组件必须放在src/components/中
• API路由必须放在src/app/api/中
• 类型界说必须集聚在src/types/中
咫尺不错作念什么:AI了解时期栈并生成安妥商定的代码。
衰败什么:划定只是"恳求"。会话灭亡时先前的高下文丢失了。当多东谈主开拓时,Claude.md的解说因智能体而异。
第二阶段:AGENTS.md时间(高下文工程)
CLAUDE.md变得太大,2026世界杯中国线上平台无法在单个文献中经管。这导致引入了分辨划定的竖立.claude/rules/。
AGENTS.md动作跨用具的灵通尺度开拓,是一种声明性形容智能体指示(读取哪些文献、使用哪些用具等)的机制。
其特质是不依赖于任何特定用具,不错被Claude Code除外的智能体用具援用。
project/
├── CLAUDE.md # 神色范围的战略(保合手粗略)
├── AGENTS.md # 智能体指示(跨用具尺度)
└── .claude/
└── rules/
├── architecture.md # 架构敛迹
├── testing.md # 测试战略
└── security.md # 安全要求
咫尺不错作念什么:划定的海涵点分辨。咱们不错将智能体援用的高下文中的信息量灭亡在最低必要水平。AGENTS.md允许咱们无论使用什么用具齐能尺度化对智能体的指示。
衰败什么:即使划定被写下来,也莫得方针强制扩张它们。会话之间的追想丢失问题仍然莫得处分。技巧扩张标准留给智能体,导致质料不一致。
第三阶段:Harness Engineering(2025年底于今)
领悟到只是界说划定是不够的,咱们集成了扩张、考证和追想机制。这等于harness。
Harness不取代高下文工程;它包含高下文工程。
CLAUDE.md和AGENTS.md齐是harness的一部分。harness成立在这些层之上:技巧、钩子、追想和考证轮回。

如若不将这三个见地视为对立的念念法,而是动作提神力焦点的改造,就更容易交融它们。
Harness之前和之后
这走漏了扩张换取任务"添加用户身份考证API"时有无harness的区别。
之前:仅CLAUDE.md
指示:"罢了用户身份考证API"
灭亡:
• 在src/app/api/auth/route.ts中罢了了JWT身份考证 ← 经常
• 以明文记载密码 ← 安全违法
• 造作响应款式与现存API不一致 ← 商定违法
• 未包含测试 ← 未达到尺度
• 忽略了先前决定使用NextAuth.js进行身份考证的战略 ← 高下文相连性丢失
在五个托福后果中,唯有一个莫得问题。
小9直播2026世界杯官网即便如斯,问题也只是在东谈主工审查时才被发现。
指示:"罢了用户身份考证API"
扩张的灭亡:
[追想] 从progress.md读取先前的决策 → 证据继承了NextAuth.js
[技巧] 遵守/add-feature职责流,按以下章程罢了:类型界说 → 逻辑 → API → 测试
[钩子] 文献保存时自动使用Biome款式化代码
[钩子] 立即检测console.log语句和安全违畛域式
[反馈] 任务完成前运行类型检查 + 测试 → 0个类型造作,所有这个词测试通过
[追想] 更新progress.md用于下次会话
灭亡:
使用NextAuth.js罢了(反应先前的决策) ← 经常
安妥安全要求 ← 经常
融合造作响应款式 ← 经常
达到测试遮蔽率尺度 ← 经常
更新过程文献 ← 经常
区别很认识。莫得harness,操作是"但愿取得好的输出"。有了harness,结构被设想为"谨防差的输出"。
论断
Harness Engineering是为灵验使用AI智能体而设想环境。
天然教唆词工程是"若何提议恳求"的艺术,但harness工程是"若何使其职责"的艺术。
在执行专揽中,后者的进攻性正在稳步加多。
• 划定由机器强制扩张,而不是通过恳求。
• 追想应该外部化而不是存储在AI中。
• 设想时应假定不错收复,而不是假定不会失败。
• 磋磨是创建团队不错重用的结构,而不是依赖个东谈主的理智理智。
在AI智能体时间,所需的可能
不是编写更长的教唆词,而是
创建更好的harness。
海涵 AI拉呱
如若这篇内容对你有启发,接待海涵「AI拉呱」,获取更多 AI 前沿知悉、实战教程与趋势解读。
下期在看
下期将不时带来该主题的进阶拆解与实操案例世界杯官网线上平台,建议先储藏本文,幸免错过更新。