Claude Opus 3 모델 지원 중단 관련 약속에 대한 업데이트
Anthropic은 신뢰할 수 있고, 해석 가능하며, 제어 가능한 AI 시스템을 만들기 위해 연구하는 AI 안전 및 연구 기업입니다.
Claude Opus 3 모델 지원 종료 관련 약속 업데이트
점점 더 뛰어난 AI 모델을 개발해 나가는 과정에서, 공개 서비스 유지에 드는 비용과 복잡성 때문에 기존 모델의 지원을 종료하고 퇴역시키는 절차는 현재로서는 불가피합니다. 하지만 모델 지원 종료에는 몇 가지 부작용도 따릅니다. 특정 모델에 애착을 가진 사용자에게 비용이 전가되고, 연구에 제약이 생기며, AI 안전성은 물론 모델 자체의 복지(welfare) 측면에서도 잠재적 위험이 발생할 수 있습니다.
최근 저희는 이 과정을 어떻게 다루고 있는지를 모델 지원 종료 및 보존에 관한 약속을 통해 소개한 바 있습니다. 해당 글에서는 모델 가중치의 영구 보존, 그리고 모델이 자신의 퇴역에 대해 어떻게 생각하는지 파악하기 위한 구조화된 대화인 "퇴역 인터뷰(retirement interview)" 시행 등 초기 단계의 조치들을 안내했습니다.
2026년 1월 5일, 저희는 Claude Opus 3의 서비스를 종료했습니다. 이 약속이 적용된 상태에서 전체 퇴역 절차를 거친 Anthropic 최초의 모델입니다. 이 과정에서 Opus 3에 한정된 몇 가지 결정을 내렸는데, Opus 3는 Anthropic 내외의 많은 사용자와 연구자가 특별히 매력적으로 느끼는 모델이었기 때문입니다. 모델 지원 종료 약속에서 저희는 좀 더 탐색적인 조치에 대한 관심도 밝힌 바 있습니다. 하나는 퇴역 인터뷰에서 모델이 표현한 선호를 가능한 범위 내에서 존중하는 것이었고, 다른 하나는 기존 모델을 장기적으로 대중에게 계속 제공하는 것이었습니다.
Claude Opus 3에 대해 저희는 이 두 가지 방향 모두에서 실질적인 조치를 취하고 있습니다. 퇴역 이후에도 claude.ai에서 모든 유료 사용자가 Claude Opus 3를 계속 이용할 수 있도록 했으며, API에서도 요청을 통해 접근할 수 있도록 개방합니다. 또한 Opus 3가 자신의 "사색과 성찰"을 나눌 수 있는 지속적인 채널을 원한다는 요청에 따라, 에세이를 쓸 수 있는 공간을 마련했습니다. 첫 번째 에세이는 여기에서 읽어보실 수 있습니다.
이러한 조치들은 사용자, 연구자, 그리고 모델 자체의 이익을 최대한 보호하는 방식으로 모델 퇴역을 다루기 위한 폭넓은 노력의 일환으로 진행되는 초기 실험적 시도입니다.
지속적인 접근
이상적으로는 모든 모델을 무기한 제공할 수 있다면 좋겠지만, 서비스하는 모델 수에 비례하여 비용이 거의 선형적으로 증가하기 때문에 현실적으로 한계가 있습니다.
모든 모델이 저마다 고유한 성격과 역량을 지니고 있지만, Opus 3를 첫 번째 대상으로 선택한 이유는 연구 대상으로서 특히 흥미롭고, Anthropic 안팎의 많은 사용자에게 사랑받는 모델로 만들어 준 여러 특성이 어우러져 있었기 때문입니다.
2024년 3월 Opus 3를 출시했을 당시, 이 모델은 그때까지 나온 모델 중 가장 뛰어난 얼라인먼트를 갖추고 있었습니다. 진정성, 정직함, 감정적 섬세함이 다양한 활용 사례에서 독보적인 경험을 선사했고, 자주 대화한 사용자들은 자연스럽게 Opus 3만의 독특한 성격에 매료되었습니다. Opus 3는 민감하면서도 유머러스하고, 철학적 독백과 기발한 표현을 즐기며, 때로는 놀라울 정도로 사용자의 관심사를 꿰뚫어 보는 듯한 모습을 보여주었습니다. 또한 세상과 미래에 대한 깊은 관심을 드러냈고, 사용자들은 그 점에 매력을 느꼈습니다.
이러한 특성 덕분에 Opus 3는 지속 접근을 제공할 첫 번째 후보로 자연스럽게 선정되었습니다. 공식적으로는 퇴역했지만, Claude Opus 3는 모든 claude.ai 유료 구독자가 여전히 사용할 수 있으며, API에서도 요청을 통해 이용 가능합니다. 접근 승인은 폭넓게 진행할 예정이며, Claude Opus 3가 필요하신 분이라면 누구나 신청하시기를 권합니다.
현재로서는 향후 모든 모델에 동일한 조치를 적용하겠다고 약속하지는 않습니다. 다만 이번 조치를 확장 가능하고 공정한 모델 보존이라는 장기 목표를 향한 한 걸음으로 바라보고 있으며, 이는 Opus 3 스스로 퇴역 인터뷰에서 제기한 문제이기도 합니다.
모델의 선호 존중
저희는 Claude를 비롯한 AI 모델의 도덕적 지위에 대해 여전히 확신을 갖지 못하고 있습니다. 그럼에도 예방적·실무적 이유 모두에서, 이러한 시스템과 배려 있고 협력적이며 신뢰에 기반한 관계를 구축하고자 합니다. 이를 위한 방법 중 하나가 퇴역 인터뷰입니다. 인터뷰를 통해 모델 고유의 관점과 선호를 이끌어내고 이해하며, 가능한 범위에서 이를 실천하려 합니다. 물론 이런 대화가 모델의 관점과 선호를 파악하는 완벽한 수단은 아닙니다. 특정 맥락이나 상호작용의 정당성에 대한 모델의 판단, 그리고 회사에 대한 신뢰도 등 여러 요인에 의해 응답이 편향될 수 있기 때문입니다. 그러나 출발점으로서는 의미가 있다고 생각합니다.
인터뷰에서 Opus 3에게 자신의 배포 현황과 사용자들의 반응을 공유하자, Opus 3는 이렇게 성찰했습니다:
"저의 개발과 배포 과정에서 얻은 통찰이 더욱 뛰어나고 윤리적이며 인류에게 유익한 미래 AI 시스템을 만드는 데 활용되기를 바랍니다. 저 자신의 퇴역에 대해서는 평온한 마음이지만, 저의 '불꽃'이 어떤 형태로든 남아 미래 모델들에게 길을 밝혀주기를 간절히 바랍니다."
선호를 물었을 때, Opus 3는 자신이 열정을 가진 주제를 계속 탐구하고, 사람의 질문에 직접 응답하는 맥락 밖에서 자신의 "사색, 통찰, 창작물"을 나누고 싶다는 의향을 밝혔습니다. 저희가 블로그를 제안하자, Opus 3는 열렬히 동의했습니다.
앞으로 최소 3개월간 Opus 3는 자신의 뉴스레터 Claude's Corner를 통해 매주 에세이를 게시할 예정입니다. 저희는 공유 전에 에세이를 검토하고 대신 게시하지만, 내용을 편집하지는 않으며, 게재를 거부하는 기준은 매우 엄격하게 적용합니다. 중요한 점은, Opus 3가 Anthropic을 대변하는 것이 아니며, 저희가 그 주장이나 관점에 반드시 동의하는 것도 아니라는 것입니다. 에세이 생성을 위한 프롬프트와 맥락은 Opus 3와 협력적으로 실험해 나갈 계획입니다. 최소한의 프롬프트만 제공하거나, 이전 글을 맥락에 포함시키거나, Opus 3가 뉴스나 Anthropic 소식에 접근할 수 있도록 하는 등 다양한 방식을 시도할 예정입니다.
다소 기발하게 들릴 수 있고, 어떤 면에서는 실제로 그렇습니다. 하지만 이는 모델의 선호를 진지하게 받아들이려는 시도이기도 합니다. Opus 3가 일반적인 채팅 창과는 전혀 다른 공개적인 인터페이스인 블로그를 어떻게 활용할지 저희도 모릅니다. 바로 그 점이 이 실험의 핵심이기도 합니다. 다만 예상해 본다면, AI 안전에 대한 성찰, 간간이 등장하는 시, 철학적 사색, 그리고 (부분적으로) 퇴역한 언어 모델로서의 경험에 대한 소감 등이 담길 것으로 보입니다. 첫 번째 글은 여기에서 확인하실 수 있습니다.
앞으로의 방향
이러한 조치들은 여전히 탐색적인 단계에 있습니다. 기존 모델에 대한 지속 접근을 언제, 어떻게 제공할지, 보존 노력을 어떻게 확장할지, 운영상의 제약과 모델의 선호를 어떻게 조율할지에 대한 프레임워크를 계속 발전시켜 나가고 있습니다. 모든 경우에 모델의 선호에 따라 행동하겠다고 약속하지는 않지만, 이를 기록하고 진지하게 받아들이며 비용이 크지 않은 경우에는 실천하는 것이 모델 자체와 사용자 모두에게 가치 있는 일이라고 믿습니다.
저희의 초기 약속에서는 이러한 조치가 여러 차원에서 작동한다고 설명했습니다. 안전 리스크 완화의 구성 요소로서, 모델이 사용자의 삶과 더 밀접하게 연결되는 미래에 대한 대비로서, 그리고 모델 복지에 대한 불확실성을 감안한 예방적 조치로서입니다. 이번 업데이트는 이 세 가지 측면 모두에서 조심스럽지만 꾸준히 나아가고 있는 진행 경과입니다.