릴리즈아티클커뮤니티
아티클 목록
AnthropicAnthropic연구Economic Research

AI가 노동 시장에 미치는 영향: 새로운 측정 방식과 초기 분석 결과

Anthropic은 안전하고 해석 가능하며 제어 가능한 AI 시스템을 구축하기 위해 연구하는 AI 안전 연구 기업입니다.

원본 링크
경제 연구

AI가 노동 시장에 미치는 영향: 새로운 측정 방식과 초기 분석 결과

2026년 3월 5일
Labor market impacts of AI: A new measure and early evidence

주요 발견

  • LLM의 이론적 역량과 실제 사용 데이터를 결합한 새로운 AI 대체 위험 측정 지표인 관측 노출도(observed exposure)를 제안합니다. 이 지표는 증강(augmentative)보다 자동화(automated) 용도에, 그리고 업무 관련 사용에 더 높은 가중치를 부여합니다
  • AI는 이론적 역량에 훨씬 미치지 못하는 상태입니다. 실제 활용 범위는 기술적으로 가능한 수준의 일부에 불과합니다
  • 관측 노출도가 높은 직업일수록 미국 노동통계국(BLS)의 2034년까지 고용 성장 전망이 낮게 나타납니다
  • 가장 노출도가 높은 직업군의 종사자는 고연령, 여성, 고학력, 고소득일 가능성이 상대적으로 높습니다
  • 2022년 말 이후 노출도가 높은 직업군에서 실업률이 체계적으로 증가한 증거는 발견되지 않았습니다. 다만, 노출된 직업에서 젊은 층의 채용이 둔화되었을 가능성을 시사하는 예비적 증거는 확인됩니다

서론

AI가 빠르게 확산되면서 노동 시장에 미치는 영향을 측정하고 예측하려는 연구가 쏟아지고 있습니다. 그러나 과거 접근법의 실적을 돌아보면, 겸손한 자세가 필요합니다.

예를 들어, 일자리의 해외 이전 가능성(offshorability)을 측정한 대표적인 연구에서는 미국 일자리의 약 4분의 1이 위험하다고 진단했지만, 10년이 지난 시점에서 해당 일자리 대부분은 건전한 고용 성장세를 유지했습니다. 정부의 직업별 성장 전망도 방향은 맞았지만, 과거 추세를 단순 선형 외삽한 것 이상의 예측력은 거의 보태지 못했습니다. 과거를 돌아봐도 대규모 경제 충격이 노동 시장에 미친 영향은 종종 불분명합니다. 산업용 로봇의 고용 효과에 대한 연구들은 서로 상반된 결론에 도달하며, 중국발 무역 충격으로 인한 일자리 손실 규모도 여전히 논쟁 중입니다.1

본 논문에서는 AI의 노동 시장 영향을 이해하기 위한 새로운 프레임워크를 제시하고, 초기 데이터와 대조 검증한 결과를 보고합니다. 현재까지 AI가 고용에 영향을 미쳤다는 증거는 제한적입니다. 이 연구의 목표는 AI가 고용에 어떤 영향을 미치고 있는지 측정하는 방법론을 확립하고, 이를 주기적으로 재검토하는 것입니다. 이 접근법이 AI가 노동 시장을 변화시키는 모든 경로를 포착하지는 못하겠지만, 유의미한 효과가 나타나기 전에 기반을 마련해 둠으로써, 향후 분석이 사후적(post-hoc) 분석보다 경제적 변동을 더 신뢰성 있게 식별할 수 있기를 바랍니다.

AI의 영향이 누가 봐도 명확한 수준일 가능성도 있습니다. 그러나 이 프레임워크는 효과가 모호할 때 가장 유용하며, 대체가 가시화되기 전에 가장 취약한 일자리를 미리 파악하는 데 도움이 될 수 있습니다.


반사실적 추론(Counterfactuals)

인과 추론은 효과가 크고 갑작스러울 때 수월합니다. 코로나19 팬데믹과 그에 따른 정책 조치는 워낙 극적인 경제 충격을 일으켰기 때문에, 많은 질문에 대해 정교한 통계 기법이 필요하지 않았습니다. 예를 들어, 팬데믹 초기 몇 주 만에 실업률이 급등하여 다른 해석의 여지가 거의 없었습니다.

하지만 AI의 영향은 코로나19보다는 인터넷이나 중국과의 무역에 가까운 양상을 보일 수 있습니다. 총 실업률 데이터만으로는 효과가 바로 드러나지 않을 수 있으며, 무역 정책이나 경기 순환 같은 요인이 추세 해석을 흐리게 만들 수 있습니다.

이에 대한 일반적인 접근법은 AI 노출도가 높은 근로자·기업·산업과 낮은 그룹의 성과를 비교하여 교란 요인으로부터 AI의 효과를 분리하는 것입니다.2 노출도는 주로 과업(task) 수준에서 정의됩니다. 예를 들어 AI는 숙제 채점은 가능하지만 교실 관리는 하지 못하므로, 교사는 모든 업무를 원격으로 수행할 수 있는 직업에 비해 노출도가 낮다고 봅니다.

본 연구도 이러한 과업 기반 접근법을 따르며, AI의 이론적 역량과 실제 사용 데이터를 결합한 뒤 직업 단위로 집계합니다.3

노출도 측정

본 연구의 접근법은 세 가지 데이터 소스를 결합합니다.

  1. O*NET 데이터베이스: 미국 내 약 800개 고유 직업에 관련된 과업을 열거한 데이터베이스
  2. Anthropic의 자체 사용 데이터(Anthropic Economic Index로 측정)
  3. Eloundou et al.(2023)의 과업 수준 노출도 추정치: LLM이 특정 과업의 수행 속도를 이론적으로 2배 이상 높일 수 있는지를 측정한 지표

Eloundou et al.의 지표 β는 단순한 척도로 과업을 평가합니다. LLM 단독으로 과업 속도를 2배로 높일 수 있으면 1, LLM 위에 추가 도구나 소프트웨어가 필요하면 0.5, 그 외에는 0으로 점수를 부여합니다.4

실제 사용이 이론적 역량에 미치지 못하는 이유는 무엇일까요? 이론적으로 가능한 일부 과업은 모델의 한계 때문에 사용 데이터에 나타나지 않을 수 있습니다. 또한 법적 제약, 특정 소프트웨어 요구사항, 사람의 검증 단계 등 여러 장벽 때문에 확산이 지연될 수 있습니다. 예를 들어, Eloundou et al.은 "약품 재처방을 승인하고 약국에 처방 정보를 제공하는 업무"를 완전 노출(β=1)로 분류합니다. 실제로 Claude가 이 과업을 수행하는 것은 관측되지 않았지만, LLM으로 이론적으로 속도를 높일 수 있다는 평가 자체는 타당해 보입니다.

그럼에도 이론적 역량과 실제 사용 간의 상관관계는 높습니다. 그림 1에서 볼 수 있듯이, 지난 네 차례의 Economic Index 보고서에서 관측된 과업의 97%가 Eloundou et al.이 이론적으로 수행 가능하다고 평가한 범주(β=0.5 또는 β=1.0)에 해당합니다.

그림 1: Eloundou et al. 과업 노출도 등급별 Claude 사용 비중
이 그림은 O*NET 과업을 이론적 AI 노출도에 따라 그룹화하고, 각 그룹의 Claude 사용 분포를 보여줍니다. β=1(LLM 단독으로 완전히 수행 가능)로 평가된 과업이 관측된 Claude 사용의 68%를 차지하며, β=0(수행 불가능)으로 평가된 과업은 3%에 불과합니다. Claude 사용 데이터는 지난 네 차례의 Economic Index 보고서에서 가져왔습니다.


새로운 직업 노출도 측정 지표

본 연구의 새로운 지표인 관측 노출도는 다음과 같은 질문을 정량화하기 위해 설계되었습니다: LLM이 이론적으로 속도를 높일 수 있는 과업 중 실제로 업무 환경에서 자동화된 형태로 사용되고 있는 것은 무엇인가? 이론적 역량은 훨씬 넓은 범위의 과업을 포괄합니다. 이 격차가 줄어드는 과정을 추적함으로써, 관측 노출도는 경제 변화가 발생하는 시점에 이를 포착하는 통찰을 제공합니다.

본 지표는 일자리 영향을 예측하는 데 유의미하다고 판단되는 AI 사용의 여러 측면을 정성적으로 반영합니다. 어떤 직업의 노출도가 높아지는 조건은 다음과 같습니다:

  • 해당 과업이 AI로 이론적으로 수행 가능한 경우
  • 해당 과업이 Anthropic Economic Index에서 상당한 사용량을 보이는 경우5
  • 해당 과업이 업무 관련 맥락에서 수행되는 경우
  • 자동화 사용 패턴이나 API 구현의 비중이 상대적으로 높은 경우
  • AI의 영향을 받는 과업이 해당 직무 전체에서 차지하는 비중이 큰 경우6

수학적 세부 사항은 부록에서 설명합니다. LLM으로 이론적으로 수행 가능한 과업이 Claude 트래픽에서 충분한 업무 관련 사용량을 보이면 '커버됨'으로 간주합니다. 그런 다음 과업 수행 방식에 따라 가중치를 조정합니다. 완전 자동화 구현은 전체 가중치를, 증강적 사용은 절반 가중치를 부여합니다. 마지막으로, 과업 수준 커버리지 지표를 각 과업에 소요되는 시간 비중으로 가중 평균하여 직업 수준으로 집계합니다.

그림 2는 관측 노출도(빨간색)를 Eloundou et al.의 β(파란색)와 비교하여, 주요 직업 범주별로 이론적 역량과 실제 플랫폼 사용 간의 차이를 보여줍니다. 먼저 시간 비중 가중치를 사용해 직업 수준으로 평균하고, 이후 총 고용 규모로 가중하여 직업 범주 수준으로 다시 평균했습니다. 예를 들어, β 지표에 따르면 컴퓨터·수학(94%)과 사무·행정(90%) 직종은 과업 대부분에서 LLM 도입의 여지가 있는 것으로 나타납니다.

그림 2: 직업 범주별 이론적 역량과 관측 노출도LLM이 이론적으로 수행 가능한 직무 과업의 비중(파란색 영역)과 사용 데이터에서 도출한 직무 커버리지 지표(빨간색 영역).

빨간색 영역은 Anthropic Economic Index에서 확인된 LLM 사용으로, 사람들이 업무 환경에서 Claude를 어떻게 활용하고 있는지를 나타냅니다. 이 커버리지를 보면 AI가 이론적 역량에 훨씬 미치지 못하고 있음을 알 수 있습니다. 예를 들어, Claude는 현재 컴퓨터·수학 분야 전체 과업의 33%만 커버하고 있습니다.

역량이 발전하고 채택이 확산되며 활용이 심화됨에 따라, 빨간색 영역은 파란색 영역을 점차 채워 나갈 것입니다. 물론 커버되지 않은 영역도 상당합니다. 나무 가지치기나 농기계 운전 같은 물리적 농업 노동, 법정에서 의뢰인을 대리하는 법률 업무 등 AI의 범위 밖에 있는 과업은 여전히 많습니다.

그림 3은 이 지표 기준으로 가장 노출도가 높은 상위 10개 직업을 보여줍니다. Claude가 코딩에 광범위하게 사용된다는 다른 데이터와 일관되게, 컴퓨터 프로그래머가 75% 커버리지로 1위에 올랐습니다. 그 뒤를 이어 고객 서비스 담당자가 위치하는데, 이들의 주요 과업은 자사 API 트래픽에서 점점 더 많이 관측되고 있습니다. 데이터 입력 담당자는 주요 과업인 원본 문서 판독 및 데이터 입력에서 상당한 자동화가 이루어져 67% 커버리지를 보입니다.

그림 3: 가장 노출도가 높은 직업과업 커버리지 지표 기준 상위 10개 직업.



반대로 하위 30%의 근로자는 커버리지가 0입니다. 이들의 과업이 데이터에서 최소 기준치를 충족할 만큼 빈번하게 나타나지 않았기 때문입니다. 이 그룹에는 요리사, 오토바이 정비사, 인명구조원, 바텐더, 설거지 담당, 탈의실 안내원 등이 포함됩니다.

노출도와 고용 성장 전망 및 근로자 특성 간의 관계

미국 노동통계국(BLS)은 정기적으로 고용 전망을 발표하며, 2025년에 공개된 최신 전망은 2024년부터 2034년까지 모든 직업의 예상 고용 변화를 다룹니다. 그림 4에서는 직업별 커버리지 지표를 BLS 전망과 비교합니다.

현재 고용 규모로 가중한 직업 수준 회귀분석 결과, 관측 노출도가 높은 직업일수록 고용 성장 전망이 다소 낮게 나타납니다. 커버리지가 10%p 증가할 때마다 BLS 성장 전망이 0.6%p 하락합니다. 이는 본 연구의 지표가 노동 시장 분석가들이 독립적으로 도출한 추정치와 연동된다는 점에서 일종의 타당성 검증이 되지만, 그 관계의 크기는 작습니다. 흥미로운 점은 Eloundou et al.의 지표만으로는 이러한 상관관계가 나타나지 않는다는 것입니다.


그림 4: 2024~2034년 BLS 고용 성장 전망 대비 관측 노출도25개 균등 구간으로 나눈 빈 산점도(binned scatterplot). 각 실선 점은 해당 구간의 평균 관측 노출도와 고용 변화 전망을 나타냅니다. 점선은 현재 고용 수준으로 가중한 단순 선형 회귀 적합선입니다. 작은 다이아몬드는 예시 직업을 표시합니다.

그림 5는 ChatGPT 출시 직전 3개월(2022년 8~10월), 인구동태조사(Current Population Survey) 데이터를 활용하여 노출도 상위 25%(1사분위)와 노출도 0인 하위 30% 근로자의 특성을 보여줍니다.7 두 집단은 상당히 다릅니다. 노출도가 높은 집단은 여성 비율이 16%p 높고, 백인 비율이 11%p 높으며, 아시아계 비율은 거의 2배에 달합니다. 평균 소득은 47% 더 높고, 교육 수준도 높습니다. 예를 들어, 대학원 학위 소지자 비율이 비노출 집단에서는 4.5%이지만 노출도가 가장 높은 집단에서는 17.4%로, 거의 4배 차이입니다.


그림 5: 인구동태조사 기준, 고노출·저노출 근로자 간 차이

분석 대상 성과 지표의 선정

노출도 측정 지표를 확보한 다음 문제는, 무엇을 관찰할 것인가입니다. 연구자들은 다양한 접근법을 취해 왔습니다. 예를 들어, Gimbel et al.(2025)은 인구동태조사를 활용하여 직업 구성의 변화를 추적합니다. 이들의 논거는, AI로 인한 중요한 경제 구조 재편이 있다면 직업 분포의 변화로 나타날 것이라는 점입니다.¹ (분석 결과, 현재까지 변화는 특이할 것 없는 수준이었습니다.) Brynjolfsson et al.(2025)은 급여 처리 업체 ADP의 데이터를 활용해 연령대별 고용 수준을 살펴보았고, Acemoglu et al.(2022)과 Hampole et al.(2025)은 각각 Burning Glass(현 Lightcast)와 Revelio의 구인 공고 데이터를 활용했습니다.

본 연구에서는 실업률을 주요 분석 대상으로 설정합니다. 실업률이 경제적 피해의 가능성을 가장 직접적으로 포착하기 때문입니다—실업자는 일자리를 원하지만 아직 찾지 못한 사람입니다. 이 관점에서 보면, 구인 공고나 고용 수준이 반드시 정책적 대응의 필요성을 뜻하는 것은 아닙니다. 노출도가 높은 직무의 구인이 줄더라도 인접 직무에서 증가로 상쇄될 수 있기 때문입니다. AI로 인한 대부분의 부정적 노동 시장 변화에는, 대체된 근로자가 대안을 찾는 과정에서 실업이 증가하는 기간이 수반될 것으로 보입니다. 인구동태조사는 실업 응답자가 직전 직업과 산업을 보고하므로 이를 추적하기에 적합합니다.


초기 분석 결과

다음으로, 직업 수준 지표를 인구동태조사 응답자에 매칭하여 실업 추세를 분석합니다.

커버리지 지표를 해석할 때 핵심적인 질문은, 어떤 근로자를 처치 집단(treated)으로 볼 것인가입니다. 과업 커버리지가 10%에 불과해도 고용 변화를 예상해야 할까요? Gans and Goldfarb(2025)는 직무가 O-ring 모형으로 잘 설명된다면, 모든 과업에 어느 정도 AI가 침투해야 비로소 고용 효과가 나타날 수 있음을 보여줍니다. Hampole et al.(2025)은 평균 노출도가 노동 수요를 감소시키지만, 특정 과업에 노출이 집중되면 이를 상쇄할 수 있다고 주장합니다. Autor and Thompson(2025)은 잔여 과업에 요구되는 전문성 수준을 강조합니다.

단순성을 지향하고 대규모 영향에 주목한다는 점에서, 본 분석은 평균 노출도가 가장 높은 집단에서 영향이 가장 먼저 나타날 것이라는 전제를 중심으로 합니다. 시간 가중 과업 커버리지 상위 25% 근로자를 하위 25%와 비교합니다. AI 역량이 빠르게 발전하면 낮은 백분위의 커버리지도 높아질 수 있어 절대적 기준이 더 유용할 수 있지만, 여기서는 가장 노출된 근로자가 먼저 영향을 받는다고 가정하고, 처치 집단 정의에 사용하는 기준치를 변경한 결과도 함께 제시합니다.

그림 6의 상단 패널은 2016년 이후 노출도 상위 25% 근로자와 비노출 집단의 실업률 원시 추세를 보여줍니다. 코로나19 시기에는 대면 직업 비중이 높은 AI 저노출 근로자의 실업률이 훨씬 크게 증가했습니다. 이후 두 집단의 추세는 대체로 비슷합니다. 하단 패널은 이중차분(difference-in-differences) 프레임워크에서 고노출·저노출 근로자 간 격차를 측정한 것으로, 원시 데이터의 결과와 일치합니다. ChatGPT 출시 이후 격차의 평균 변화는 작고 통계적으로 유의하지 않아, 고노출 집단의 실업률이 소폭 상승했을 수 있으나 그 효과는 0과 구분할 수 없습니다.8

그림 6: 관측 노출도 상위 25%와 AI 노출 없는 근로자의 실업률 추세, 인구동태조사상단 패널은 노출도 상위 25%(빨간 선)와 노출도 0인 30% 근로자의 실업률을 보여줍니다. 하단 패널은 이중차분 프레임워크에서 두 계열 간 격차를 측정합니다.


이 프레임워크는 어느 수준의 시나리오까지 식별할 수 있을까요? 통합 추정치의 신뢰 구간을 기준으로, 약 1%p 수준의 차별적 실업률 증가는 감지 가능합니다(새 데이터가 추가되면 달라질 수 있어 대략적인 추정치입니다). 만약 상위 10% 내 모든 근로자가 해고된다면, 상위 25% 집단의 실업률은 3%에서 43%로 치솟고, 전체 실업률은 4%에서 13%로 올라갈 것입니다.

규모는 작지만 여전히 우려할 만한 시나리오로는 "화이트칼라 대상 대침체(Great Recession)"를 상정해 볼 수 있습니다. 2007~2009년 대침체 기간에 미국의 실업률은 5%에서 10%로 2배가 되었습니다. 노출도 상위 25%에서 이와 같은 2배 증가가 발생하면 실업률이 3%에서 6%로 상승할 것이며, 이는 본 분석에서 충분히 감지될 수 있는 수준입니다. 참고로 본 분석의 핵심 추정치는 노출 집단과 저노출 집단 간 실업률의 차별적 변화에 기반합니다. 모든 근로자의 실업률이 동일하게 상승한다면, 이를 아직 많은 과업에 영향을 미치지 않는 AI 발전의 결과로 귀속하지는 않을 것입니다.

특히 우려되는 집단은 젊은 근로자입니다. Brynjolfsson et al.은 22~25세 근로자의 노출 직업 내 고용이 6~16% 감소했다고 보고합니다. 이들은 이 감소가 이직 증가보다는 주로 채용 둔화에 기인한다고 분석합니다.9

본 연구에서는 노출 직업의 젊은 근로자 실업률이 보합 수준인 것으로 나타납니다(부록 참조). 그러나 채용 둔화가 반드시 실업률 상승으로 나타나는 것은 아닙니다. 많은 젊은 근로자는 처음 노동 시장에 진입하는 사람들로, 인구동태조사에 직업이 기재되지 않으며, 실업자로 집계되기보다 비경제활동인구로 빠질 수 있습니다. 채용을 직접 분석하기 위해, 인구동태조사의 패널 차원을 활용하여 22~25세 젊은 근로자가 시간에 따라 고노출 직업과 저노출 직업에서 새로 취업하는 비율을 산출했습니다. 그림 7은 젊은 근로자의 월별 취업률(전월에 없던 일자리를 보고하는 경우)을 고노출 직업과 저노출 직업으로 구분하여 보여줍니다.

그림 7: 관측 노출도 상위와 AI 노출 없는 직업에서의 22~25세 근로자 신규 취업, 인구동태조사상단 패널은 고노출 직업 대비 비노출 직업에서 새로 취업하는 젊은 근로자 비율을 보여줍니다. 하단 패널은 이중차분 프레임워크에서 두 계열 간 격차를 측정합니다.

2020~2021년의 큰 변동을 제외하면, 두 계열은 2024년에 시각적으로 벌어지기 시작하며, 젊은 근로자가 노출 직업에 채용될 가능성이 상대적으로 낮아집니다. 저노출 직업의 취업률은 월 2% 수준에서 안정적인 반면, 고노출 직업 진입률은 약 0.5%p 감소합니다. ChatGPT 출시 이후 기간의 평균 추정치는 노출 직업 내 취업률이 2022년 대비 14% 하락한 것으로, 통계적 유의성은 가까스로 확보되는 수준입니다. (25세 초과 근로자에서는 이러한 감소가 나타나지 않습니다.)

이 결과는 AI가 고용에 미치는 초기 효과를 시사하는 신호일 수 있으며, Brynjolfsson et al.의 발견과도 일맥상통합니다. 그러나 여러 대안적 해석이 가능합니다. 채용되지 않은 젊은 근로자들이 기존 일자리에 머물거나, 다른 직업을 택하거나, 학업으로 복귀했을 수 있습니다. 데이터 측면에서도 직업 이동은 설문조사에서 측정 오류가 발생하기 쉽다는 점을 유의해야 합니다.10


논의

본 보고서는 AI의 노동 시장 효과를 파악하기 위한 새로운 지표를 도입하고, 실업 및 채용에 미치는 영향을 분석했습니다. 직업의 AI 노출도는 해당 과업이 LLM으로 이론적으로 수행 가능하면서 동시에 자동화된 업무 관련 용례로 플랫폼에서 관측되는 정도에 따라 결정됩니다. 분석 결과, 컴퓨터 프로그래머, 고객 서비스 담당자, 재무 분석가가 가장 높은 노출도를 보입니다. 미국 설문조사 데이터를 활용한 결과, 노출도가 가장 높은 직업에서 실업률에 미치는 영향은 확인되지 않았으나, 22~25세 근로자의 해당 직업군 진입이 소폭 둔화되었다는 잠정적 증거가 있습니다.

본 연구는 AI가 노동 시장에 미치는 영향을 체계적으로 기록하기 위한 첫걸음입니다. 특히 커버리지와 반사실적 추론에 대한 분석적 접근이 고용 및 AI 사용에 관한 새로운 데이터가 나올 때마다 손쉽게 업데이트될 수 있기를 바랍니다. 확립된 방법론은 향후 관찰자들이 노이즈 속에서 의미 있는 신호를 분리하는 데 도움이 될 것입니다.

현재 연구에는 여러 개선 과제가 남아 있습니다. 향후 업데이트에서는 최신 사용 데이터를 반영하여 경제 내 과업 및 직업 커버리지의 진화하는 그림을 그려 나갈 것입니다. Eloundou et al.의 지표도 2023년 초 시점의 LLM 역량에 연동되어 있으므로 업데이트가 필요합니다. 또한, 젊은 근로자와 신규 노동 시장 진입자에 대한 예비적 결과를 고려하면, 노출도가 높은 분야의 학력을 갖춘 최근 졸업생들이 노동 시장에서 어떤 경험을 하고 있는지 살펴보는 것이 중요한 다음 단계가 될 수 있습니다.


부록

여기에서 확인할 수 있습니다.


감사의 글

작성: Maxim Massenkoff, Peter McCrory

감사를 전합니다: Ruth Appel, Tim Belonax, Keir Bradwell, Andy Braden, Dexter Callender III, Miriam Chaum, Madison Clark, Jake Eaton, Deep Ganguli, Kunal Handa, Ryan Heller, Lara Karadogan, Jennifer Martinez, Jared Mueller, Sarah Pollack, David Saunders, Carl De Torres, Kim Withee, Jack Clark

아울러 본 보고서 초기 버전에 피드백을 제공해 주신 Martha Gimbel, Anders Humlum, Evan Rose, Nathan Wilmers에게도 감사드립니다.


인용

@online{massenkoffmccrory2026labor,
 author = {Maxim Massenkoff and Peter McCrory},
 title = {Labor market impacts of AI: A new measure and early evidence},
 date = {2026-03-05},
 year = {2026},
 url = {https://www.anthropic.com/research/labor-market-impacts},
}

참고문헌

Acemoglu, Daron and Pascual Restrepo, "Robots and Jobs: Evidence from US Labor Markets," Journal of Political Economy, 2020, 128 (6), 2188–2244.

Acemoglu, Daron, David Autor, Jonathon Hazell, and Pascual Restrepo, "Artificial intelligence and jobs: Evidence from online vacancies," Journal of Labor Economics, 2022, 40 (S1), S293–S340.

Appel, Ruth, Maxim Massenkoff, Peter McCrory, Miles McCain, Ryan Heller, Tyler Neylon, and Alex Tamkin, "Anthropic Economic Index report: economic primitives," 2026.

Autor, David H, David Dorn, and Gordon H Hanson, "The China syndrome: Local labor market effects of import competition in the United States," American Economic Review, 2013, 103 (6), 2121–2168.

Autor, David H, & Thompson, N. (2025). Expertise. NBER Working Paper, (w33941).

Blinder, Alan S et al., "How many US jobs might be offshorable?," World Economics, 2009, 10 (2), 41.

Borusyak, Kirill, Peter Hull, and Xavier Jaravel, "Quasi-experimental shift-share research designs," The Review of Economic Studies, 2022, 89 (1), 181–213.

Brynjolfsson, Erik, Bharat Chandar, and Ruyu Chen, "Canaries in the coal mine? six facts about the recent employment effects of artificial intelligence," Digital Economy, 2025.

Eckhardt, Sarah and Nathan Goldschlag, "AI and Jobs: The Final Word (Until the Next One)," Economic Innovation Group (EIG), August 2025. Available at: https://eig.org/ai-and-jobs-the-final-word/

Eloundou, Tyna, Sam Manning, Pamela Mishkin, and Daniel Rock, "Gpts are gpts: An early look at the labor market impact potential of large language models," arXiv preprint arXiv:2303.10130, 2023, 10.

Fujita, S., Moscarini, G., & Postel-Vinay, F. (2024). Measuring employer-to-employer reallocation. American Economic Journal: Macroeconomics, 16(3), 1-51.

Gans, Joshua S. and Goldfarb, Avi, "O-Ring Automation," NBER Working Paper No. 34639, December 2025. Available at SSRN: https://ssrn.com/abstract=5962594

Gimbel, Martha, Molly Kinder, Joshua Kendall, and Maddie Lee, "Evaluating the Impact of AI on the Labor Market: Current State of Affairs," Research Report, The Budget Lab at Yale, New Haven, CT October 2025. Available at: https://budgetlab.yale.edu.

Graetz, Georg and Guy Michaels, "Robots at Work," Review of Economics and Statistics, 2018, 100 (5), 753–768.

Hampole, Menaka, Dimitris Papanikolaou, Lawrence DW Schmidt, and Bryan Seegmiller, "Artificial intelligence and the labor market," Technical Report, National Bureau of Economic Research 2025.

Handa, Kunal, Alex Tamkin, Miles McCain, Saffron Huang, Esin Durmus, Sarah Heck, Jared Mueller, Jerry Hong, Stuart Ritchie, Tim Belonax, Kevin K. Troy, Dario Amodei, Jared Kaplan, Jack Clark, and Deep Ganguli, "Which Economic Tasks are Performed with AI? Evidence from Millions of Claude Conversations," 2025.

Hui, Xiang, Oren Reshef, and Luofeng Zhou, "The short-term effects of generative artificial intelligence on employment: Evidence from an online labor market," Organization Science, 2024, 35 (6), 1977–1989.

Johnston, Andrew and Christos Makridis, "The labor market effects of generative AI: A difference-in-differences analysis of AI exposure," Available at SSRN 5375017, 2025.

Massenkoff, Maxim, "How predictable is job destruction? Evidence from the Occupational Outlook," 2025. Working Paper.

Ozimek, Adam, "Overboard on Offshore Fears," 2019. https://papers.ssrn.com/sol3/papers.cfm?abstract_id=3777307

Tamkin, Alex and Peter McCrory, "Estimating AI productivity gains from Claude conversations," 2025.

Tomlinson, K., Jaffe, S., Wang, W., Counts, S., & Suri, S. (2025). Working with AI: measuring the applicability of generative AI to occupations. arXiv preprint arXiv:2507.07935.


각주

  1. 해외 이전 가능성: Blinder et al.(2009), Ozimek(2019); 정부 성장 전망: Massenkoff(2025); 로봇: Graetz and Michaels(2018), Acemoglu and Restrepo(2020); 중국 충격: Autor et al.(2013), Borusyak et al.(2022).

  2. Brynjolfsson et al.(2025)은 Eloundou et al.(2023)의 과업 노출도 지표와 ADP 급여 데이터를 활용하여 AI 노출도가 높은 직업과 낮은 직업 간 고용 추세를 비교합니다. Johnston and Makridis(2025)도 미국 행정 데이터를 사용해 유사한 과업 기반 분석을 수행하지만, 처치를 산업 수준으로 집계합니다. Hui et al.(2024)은 ChatGPT와 고급 이미지 생성 도구 출시 전후의 Upwork 프리랜서 일자리를 연구하며, 직접 영향을 받는 범주와 그렇지 않은 범주의 근로자를 비교합니다. Hampole et al.(2025)은 과거 대학 채용 네트워크를 도구 변수로 활용하여 기업 수준 AI 도입을 분석합니다. 과거에 졸업생이 나중에 AI 관련 직종에 진출한 대학에서 주로 채용한 기업일수록 도입 비용이 낮았다는 논리입니다.

  3. 본 연구의 과업 및 직업 수준 노출도 지표는 다른 사용 데이터를 쉽게 통합할 수 있으며, 다른 국가로도 확장 가능합니다. 향후 새로운 환경에 이 방법론을 적용해 나갈 예정입니다.

  4. 이들의 프레임워크에서 "직접 노출(Directly exposed)" 과업은 LLM(2,000단어 입력 제한, 최신 사실 접근 불가)으로 수행 시간을 절반으로 줄일 수 있는 과업입니다. "도구 활용 시 노출(exposed with tools)" 과업은 정보 검색, 이미지 처리 등의 소프트웨어에 접근 가능한 LLM을 사용했을 때 동일한 시간 단축이 가능한 경우입니다. 노출되지 않은 과업은 LLM을 사용해도 소요 시간을 50% 이상 줄일 수 없는 경우입니다.

  5. 2025년 8월과 11월의 사용 데이터를 다룬 직전 두 차례의 Anthropic Economic Index 데이터셋을 활용했습니다. 의미적으로 매우 유사한 O*NET 과업의 경우 건수를 분할 배분했습니다.

  6. 모든 단계에서 판단이 개입됩니다. Eloundou et al.(2023)의 지표를 {0, 0.5, 1}로 적용할 것인가, 다른 형태로 할 것인가? "상당한" 사용의 기준은 무엇인가? 높은 사용량을 보이는 과업과 매우 유사하지만 Economic Index 표본에서 포착되기에는 너무 드문 과업은 어떻게 처리할 것인가? 자동화 워크플로는 증강에 비해 얼마나 더 높은 가중치를 받아야 하는가? 부록에서 자세히 다루지만, 이러한 여러 판단 기준의 변경에 대한 직업 노출도의 스피어만(순위-순위) 상관관계가 매우 높다는 점은 고무적입니다.

  7. O*NET-SOC 코드를 인구동태조사의 occ1990 코드와 매칭하기 위해 Eckhart and Goldschlag(2025)가 제공한 연계표(crosswalk)를 사용했습니다.

  8. 이에 대해 부록에서 세 가지 추가 분석을 수행합니다. 첫째, 처치 집단 정의에 사용하는 백분위 기준을 중위수에서 95백분위까지 변경해 봅니다. 모든 경우에서 영향은 보합이거나 음수(노출 집단의 실업률이 오히려 감소)입니다. 둘째, Brynjolfsson et al.(2025)과 마찬가지로 22~25세 젊은 근로자에 초점을 맞춥니다. 셋째, 인구동태조사 설문 응답 대신 노동부의 실업보험 청구 데이터를 사용하여 실업을 측정합니다. 어떤 확장 분석에서도 노출 직업에 대한 명확한 영향은 발견되지 않습니다.

  9. 이 범위가 넓은 이유는 저자들이 여러 반사실적 시나리오에 대해 추정치를 제시하기 때문입니다. 6%p 하락은 고용 성장이 보합이라는 반사실과 비교한 수치이고, 16%p 추정치는 동일 기업 내에서 다른 직업에 종사하는 유사 근로자를 비교하는 설계에서 도출되었습니다.

  10. Fujita et al.(2024) 참조.