이 글은 RLVR이 무엇이고, 왜 AI가 검증 가능한 일을 빠르게 흡수하는지, 그 흐름 속에서 나는 무엇을 해야 하는지를 정리한 글이다.
Benedict Evans는 말했다. AI is eating the world.
어떻게 먹는지를 알면, 무엇이 남는지도 보인다.
RLVR : AI가 먹는 방식
RLVR: Reinforcement Learning by Verifiable Rewards. 보상신호를 발생시킬 수 있는 도메인이라면, 충분한 Compute를 투입했을 때 AI가 정복할 수 있다.
변호사를 보자. 법률 자문의 정오(正誤)는 법과 판례로 명확히 판단된다. 보상신호가 선명하다. AI가 훈련하기 좋은 환경이다.
하지만 변호사가 법률자문만 하지는 않는다. Lawyer, Attorney, Esquire. 같은 직종처럼 보이지만 각 단어가 함의하는 무게가 다르다. 법정 안팎의 판단, 의뢰인과의 신뢰, 말하지 않아도 아는 맥락. 보상신호로 포착되지 않는 영역이 있다.
그 경계가 어디까지인지는, 아직 아무도 모른다.
판은 항상 이렇게 바뀌었다
앤스로픽은 최근 신약 개발 플랫폼을 인수하며 의료·바이오 영역으로 진입했다. RLVR이 작동하는 도메인이 하나씩 늘어가는 중이다.
산업 패러다임은 반복되는 패턴이 있다.
지배자가 생기면 bundle이 만들어진다. 고객이 틀 안에 갇힌다. 새로운 기술이 등장하면 그 bundle이 해체된다. 새로운 지배자가 나타나 다시 bundle을 만든다. 모바일이 그랬다. AI도 그렇게 가고 있다.
distribution layer가 바뀌는 순간마다 판이 새로 열렸다.
붉은 여왕의 트랙
붉은 여왕 가설이 있다.
앨리스가 붉은 여왕과 함께 달리는데, 아무리 뛰어도 주변 풍경이 바뀌지 않는다. 여왕이 말한다. "여기서는 같은 자리에 있으려면 있는 힘껏 달려야 해."
AI 시대가 그렇다. 배경이 빠르게 움직인다. 달리지 않으면 뒤처지는 게 아니라, 달려야 겨우 제자리다.
근데 이 트랙에는 이상한 점이 있다. 판이 바뀌는 순간, 트랙이 새로 그려진다. 앞서간 사람과 나 사이의 거리가 잠깐이나마 압축되는 구간이 생긴다.
문제는 방향이다. 달리는 건 알겠다. 근데 어디로?
나는 어디에 서야 하는가
솔직히 말하면, 나는 인류의 문제를 해결하는 선구자가 될 것 같지 않다. 라스트마일을 발견하기도 요원하다.
앤스로픽이 바이오를 인수하는 동안, 나는 Claude Code 설치법을 익히고 있었다.
그래도 이 비대칭전력을 기회로 쓰고 싶다는 생각은 남는다. 선구자가 못 되어도 괜찮다. 그렇다면 나는 무엇을 할 수 있는가. 그 답을 모른 채로 달리는 게 지금 내 상태다.
방향을 찾으려면 먼저 지금의 나를 봐야 한다.
나를 해체한다
그래서 결론은 이거다.
나를 unbundle하기로 했다.
코드도 처음엔 하나의 덩어리다. 커질수록 어디서 무슨 일이 일어나는지 알 수 없게 된다. 그래서 쪼갠다. 모듈로 나누고, 역할을 분리하고, 각 조각이 무엇을 하는지 명확하게 만든다. 그다음 다시 조립한다. 쪼개기 전보다 훨씬 단단하게.
나도 같다.
지금의 나를 꺼내놓고 본다. 습관, 강점, 관심사, 회피하는 것들. 전부 테이블 위에 펼쳐놓는다. 그중에서 selection한다. 흐릿한 것은 버리고, 진한 것만 남긴다. 그걸 amplify한다. 더 선명하게, 더 나답게.
산업이 diversification → selection → amplification을 반복하듯, 나도 그 루프를 돌린다.
도구도 생겼다. Ralph Loop — "구현 → 검토 → 개선"을 자기참조적으로 반복하는 루프다. AI가 이전 결과를 스스로 평가하고 다음 방향을 결정한다. 한 번에 완성되지 않는다. 반복이 다듬는다.
AI가 코드를 개선하는 방식으로, 나 자신을 개선한다.
인류의 문제를 해결하는 선구자가 되지 못해도 괜찮다. 나라는 가치를 선명하게 만들고, 그 향기에 동조하는 에너지를 모은다.
diversification → selection → amplification. 이 루프를 멈추지 않는 것, 그게 지금 내가 해야할 일이다.
이어 읽기
시리즈는 순서대로, 편집 추천은 맥락대로, 비슷한 주제는 태그 기준으로 정리합니다.
함께 읽으면 좋은 글
편집 추천비슷한 주제의 글
태그가 겹치는 글입니다. 시리즈와 편집 추천에 이미 나온 글은 제외합니다.
dev.survival.log 철학과 다짐
개발자의 언어로 나를 정의하는 방식. devsurvivallog가 존재하는 이유.
AI한테 내 인스타 분석 맡겼더니 캐릭터가 나왔다
AI가 내 인스타 포스트 10개를 분석하고 캐릭터 페르소나를 뽑아냈다. 나를 해체하는 첫 번째 시도.
Everything Claude Code (ECC) 완전 가이드
AI 에이전트 하네스를 위한 성능 최적화 시스템 — 47개 에이전트, 181개 스킬, 79개 커맨드를 즉시 사용하는 방법