AIwitness | AI Tools Update Tracker

행사장은 이미 스킬을 사용해 본 사람들로 가득했습니다.

화요일 밤, 샌프란시스코에서 Skills Night을 열었습니다. skills.sh를 중심으로 개발하고 있는 개발자들을 위한 행사였습니다. 어느 주말 글 몇 편을 쓰면서 시작된 이 오픈 스킬 생태계는 지금까지 69,000개 이상의 스킬, 200만 건의 스킬 CLI 설치, 그리고 놀라운 속도로 성장하는 커뮤니티로 발전했습니다. 시작은 Shu Ding이 자신이 아는 React 지식을 전부 문서로 정리한 것이었습니다.

그날 밤 우리가 배운 것들을 정리합니다.

시작은 이랬습니다

탄생 배경을 다시 짚어볼 필요가 있습니다. 이 이야기가 프로젝트를 바라보는 관점 자체를 형성하기 때문입니다.

Shu Ding은 제가 함께 일해 본 웹 엔지니어 중 가장 뛰어난 사람입니다. React와 브라우저에 대해 대부분의 사람이 평생 모를 수준의 지식을 갖고 있죠. 작년 어느 주말, 그는 자리에 앉아 그 모든 것을 글로 옮겼습니다. 일종의 웹 바이블이었습니다. 우리는 이걸 어떻게 전달할지 고민했습니다. 블로그 글이나 문서로 만들어 차세대 모델이 학습하게 할 수도 있었지만, 그러면 Claude Sonnet 8이나 GPT-9쯤 돼야 결과를 볼 수 있을 터였습니다. 반면 MCP 서버는 본질적으로 마크다운 문서 모음에 불과한 것치고는 너무 무거웠습니다.

스킬이야말로 필요한 지식을 즉시 전달하는 가장 빠른 방법이었습니다. React 모범 사례 설치 안내를 작성하다 보니, Cursor, Claude Code, Codex를 비롯한 10개 넘는 코딩 에이전트에 스킬을 넣기 위해 똑같은 설치 안내를 반복해서 복사·붙여넣기하고 있었습니다. 설치 디렉터리만 조금씩 달랐을 뿐입니다.

그래서 모든 주요 코딩 에이전트에 한 번에 설치할 수 있는 CLI를 만들었고, 그것이 npx skills이 되었습니다. 새 스킬이 설치될 때마다 이를 추적하는 텔레메트리를 추가했고, 그 데이터가 skills.sh 리더보드의 기반이 되었습니다. 아이디어에서 Vercel 위 프로덕션 배포까지 며칠밖에 걸리지 않았습니다. Vercel CTO Malte Ubl이 이를 정확하게 정의했습니다: 에이전트 컨텍스트를 위한 패키지 매니저라고.

현재 69,000개의 스킬을 추적하고 있으며, 발견뿐 아니라 설치까지 간편하게 만들고 있습니다. 다음과 같은 간단한 명령어만 입력하면 됩니다:

풀어야 했던 보안 문제

성장은 공격 표면을 만들고, 빠른 성장은 그 속도를 더 높입니다.

스킬이 급성장하자 품질 편차 문제도 뒤따랐습니다. Socket의 Ryan이 구체적인 사례를 보여줬습니다. 마크다운 수준에서는 완전히 깨끗해 보이지만, 설치 시 원격 셸을 여는 Python 파일이 포함된 스킬이었습니다. 디렉터리 안의 모든 파일을 직접 확인하지 않으면 절대 잡아낼 수 없는 유형입니다.

이런 이유로 Gen, Socket, Snyk과의 보안 파트너십을 발표했습니다. 기존 스킬 전체와 신규 등록되는 모든 스킬에 대해 감사를 수행합니다.

Socket은 크로스 에코시스템 정적 분석에 LLM 기반 노이즈 제거를 결합해, 자체 벤치마크 기준 정밀도 95%, 재현율 98%, F1 97%를 달성하고 있습니다.
Gen은 Sage라는 실시간 에이전트 신뢰 레이어를 구축 중입니다. 에이전트의 모든 인바운드·아웃바운드 연결을 모니터링해, 데이터 유출이나 프롬프트 인젝션 위험 없이 에이전트를 자유롭게 실행할 수 있게 합니다.
Snyk은 패키지 보안 분야의 경험을 스킬 컨텍스트에 적용하고 있습니다.

스킬별 평가와 권고 사항을 제공하는 Audits 리더보드도 구축 중입니다. 목표는 통제가 아닙니다. 확신을 갖고 빠르게 움직일 수 있게 하는 것입니다. 스킬 감사에 독자적인 관점을 더하고, 더 많은 신뢰 시그널을 제공할 수 있는 새로운 보안 파트너도 계속 찾고 있습니다.

데모에서 확인한 것들

화요일에 8개 파트너가 데모를 선보였고, 몇 가지 공통된 주제가 반복해서 등장했습니다.

스킬은 학습 데이터 컷오프 간극을 메웁니다. Ben Davis가 이를 입증하기 위해 통제 실험을 진행했습니다.

비교적 최신 API인 Svelte 원격 함수를 코딩 에이전트로 구현하는 실험이었으며, 네 가지 방식을 시도했습니다. 컨텍스트 없음, 문서가 담긴 스킬 파일, MCP를 가리키는 스킬, 프로젝트 내 코드 예시.

컨텍스트가 있는 모든 방식은 성공했습니다.

컨텍스트 없이 실행한 경우(모델이 스스로 해법을 추론하지 못하도록 기능을 제한한 상태)에는 완전히 잘못된 결과가 나왔습니다. 모델은 올바른 패턴을 제공받으면 충분히 똑똑하게 활용합니다. 컨텍스트가 없으면 오래된 학습 데이터에 의존할 수밖에 없습니다.

전달 형식보다 내용이 중요합니다. Ben의 실험에서 얻은 진짜 인사이트는 스킬만이 유일한 방법이라는 게 아니었습니다. 핵심은 올바른 컨텍스트를 넣어주는 것 자체이며, 기준점이 아직 없다면 스킬이 가장 빠른 출발점이라는 것입니다. 기존 코드 예시, 인라인 문서, MCP 힌트 모두 효과가 있습니다.

스킬은 단지 그 컨텍스트를 누구에게나 배포하는 가장 쉬운 수단일 뿐입니다.

에이전트가 이제 전체 스택을 주도할 수 있습니다. Expo의 Evan Bacon은 Expo 스킬을 활용해 Claude Code만으로 네이티브 iOS 기능을 업그레이드하는 과정을 시연했습니다.

새로운 SwiftUI 컴포넌트, 제스처 기반 전환, 탭 바 업데이트가 모두 자동으로 적용되었습니다. 현재 개발 중인 스킬에서는 LLDB 통합을 활용해 에이전트가 네이티브 iOS 뷰 계층 구조를 읽고, 악명 높은 키보드 핸들링 버그를 자동으로 수정하기도 합니다.

Expo의 프로덕션 앱 Expo Go는 이제 크래시가 발생할 때마다 자동으로 수정합니다. Xcode와 씨름해 본 경험이 있는 분이라면, 이것이 얼마나 대단한 이야기인지 아실 겁니다.

스킬이 인프라가 되고 있습니다. Nick Khami는 Mintlify가 호스팅하는 모든 문서 사이트(Claude Code 공식 문서, Coinbase, Perplexity, Lovable 등)에 대해 스킬을 자동 생성하는 기능을 선보였습니다.

이런 문서 사이트의 트래픽 중 코딩 에이전트 비중은 1년 전 10%에서 현재 50%로 늘었습니다. 스킬은 이제 문서 팀이 직접 작성하는 것이 아니라, 잘 구조화된 문서의 부산물입니다. Sentry의 David Cramer는 GitHub Actions를 통해 풀 리퀘스트에서 스킬을 린터처럼 실행하는 하네스 Warden을 만들었습니다. 에이전트를 정적 분석 레이어로 활용하는 방식입니다.

우리가 만들어 가는 방향

화요일 밤 Vercel CEO Guillermo Rauch가 한 말이 계속 머릿속에 맴돕니다: 에이전트는 실수한다.

때로는 "완전히 맞습니다"라고 말해놓고 엉뚱한 작업을 합니다. AI 시대에 품질을 지킨다는 것은 토큰을 얼마나 많이 소비하는지 자랑하는 게 아닙니다. 그 토큰이 실제로 만들어내는 결과물의 수준을 높이는 것입니다.

스킬은 이 문제에 대한 하나의 해답입니다. 에이전트가 생성하는 코드에 영향을 주고, 프레임워크 변경 사항을 최신 상태로 유지하며, 정답으로 가는 직선 경로를 제시해 불필요한 시행착오를 줄여 토큰 효율까지 높이는 수단입니다.

200만 건의 설치는 확실한 시그널입니다. 보안 파트너십 덕분에 팀 단위로 신뢰하고 사용할 수 있게 되었습니다. 그리고 데모를 통해 확인했습니다. 가장 흥미로운 스킬 활용은 CLI 수준이 아니라, 스킬을 대규모 지식 배포의 핵심 프리미티브로 다루는 에이전트와 도구 영역에서 일어나고 있습니다.

계속 만들어 나가겠습니다. skills.sh에서 만나세요.