AI가 먹고 있다, 나를 해체한다: RLVR 시대에 개발자는 무엇을 해야 하나

이 글은 RLVR이 무엇이고, 왜 AI가 검증 가능한 일을 빠르게 흡수하는지, 그 흐름 속에서 나는 무엇을 해야 하는지를 정리한 글이다.

Benedict Evans는 말했다. AI is eating the world.

어떻게 먹는지를 알면, 무엇이 남는지도 보인다.

RLVR은 AI가 먹는 방식이다

RLVR: Reinforcement Learning by Verifiable Rewards. 보상신호를 발생시킬 수 있는 도메인이라면, 충분한 Compute를 투입했을 때 AI가 정복할 수 있다.

변호사를 보자. 법률 자문의 정오(正誤)는 법과 판례로 명확히 판단된다. 보상신호가 선명하다. AI가 훈련하기 좋은 환경이다.

하지만 변호사가 법률자문만 하지는 않는다. Lawyer, Attorney, Esquire. 같은 직종처럼 보이지만 각 단어가 함의하는 무게가 다르다. 법정 안팎의 판단, 의뢰인과의 신뢰, 말하지 않아도 아는 맥락. 보상신호로 포착되지 않는 영역이 있다.

그 경계가 어디까지인지는, 아직 아무도 모른다.

판은 항상 이렇게 바뀌었다

앤스로픽은 최근 신약 개발 플랫폼을 인수하며 의료·바이오 영역으로 진입했다. RLVR이 작동하는 도메인이 하나씩 늘어가는 중이다.

산업 패러다임은 반복되는 패턴이 있다.

지배자가 생기면 bundle이 만들어진다. 고객이 틀 안에 갇힌다. 새로운 기술이 등장하면 그 bundle이 해체된다. 새로운 지배자가 나타나 다시 bundle을 만든다. 모바일이 그랬다. AI도 그렇게 가고 있다.

distribution layer가 바뀌는 순간마다 판이 새로 열렸다.

붉은 여왕의 트랙

붉은 여왕 가설이 있다.

앨리스가 붉은 여왕과 함께 달리는데, 아무리 뛰어도 주변 풍경이 바뀌지 않는다. 여왕이 말한다. "여기서는 같은 자리에 있으려면 있는 힘껏 달려야 해."

AI 시대가 그렇다. 배경이 빠르게 움직인다. 달리지 않으면 뒤처지는 게 아니라, 달려야 겨우 제자리다.

근데 이 트랙에는 이상한 점이 있다. 판이 바뀌는 순간, 트랙이 새로 그려진다. 앞서간 사람과 나 사이의 거리가 잠깐이나마 압축되는 구간이 생긴다.

문제는 방향이다. 달리는 건 알겠다. 근데 어디로?

나는 어디에 서야 하는가

솔직히 말하면, 나는 인류의 문제를 해결하는 선구자가 될 것 같지 않다. 라스트마일을 발견하기도 요원하다.

앤스로픽이 바이오를 인수하는 동안, 나는 Claude Code 설치법을 익히고 있었다.

그래도 이 비대칭전력을 기회로 쓰고 싶다는 생각은 남는다. 선구자가 못 되어도 괜찮다. 그렇다면 나는 무엇을 할 수 있는가. 그 답을 모른 채로 달리는 게 지금 내 상태다.

방향을 찾으려면 먼저 지금의 나를 봐야 한다.

나를 해체한다

그래서 결론은 이거다.

나를 unbundle하기로 했다.

코드도 처음엔 하나의 덩어리다. 커질수록 어디서 무슨 일이 일어나는지 알 수 없게 된다. 그래서 쪼갠다. 모듈로 나누고, 역할을 분리하고, 각 조각이 무엇을 하는지 명확하게 만든다. 그다음 다시 조립한다. 쪼개기 전보다 훨씬 단단하게.

나도 같다.

지금의 나를 꺼내놓고 본다. 습관, 강점, 관심사, 회피하는 것들. 전부 테이블 위에 펼쳐놓는다. 그중에서 selection한다. 흐릿한 것은 버리고, 진한 것만 남긴다. 그걸 amplify한다. 더 선명하게, 더 나답게.

산업이 diversification → selection → amplification을 반복하듯, 나도 그 루프를 돌린다.

도구도 생겼다. Ralph Loop는 "구현 → 검토 → 개선"을 자기참조적으로 반복하는 루프다. AI가 이전 결과를 스스로 평가하고 다음 방향을 결정한다. 한 번에 완성되지 않는다. 반복이 다듬는다.

AI가 코드를 개선하는 방식으로, 나 자신을 개선한다.

인류의 문제를 해결하는 선구자가 되지 못해도 괜찮다. 나라는 가치를 선명하게 만들고, 그 향기에 동조하는 에너지를 모은다.

diversification → selection → amplification. 이 루프를 멈추지 않는 것, 그게 지금 내가 해야할 일이다.

AI가 먹고 있다, 나를 해체한다

RLVR은 AI가 먹는 방식이다

판은 항상 이렇게 바뀌었다

붉은 여왕의 트랙

나는 어디에 서야 하는가

나를 해체한다

이어 읽기

함께 읽으면 좋은 글

비슷한 주제의 글

dev.survival.log 철학과 다짐

AI한테 내 인스타 분석 맡겼더니 캐릭터가 나왔다

Everything Claude Code (ECC) 완전 가이드

Command Palette

RLVR은 AI가 먹는 방식이다

판은 항상 이렇게 바뀌었다

붉은 여왕의 트랙

나는 어디에 서야 하는가

나를 해체한다

이어 읽기

함께 읽으면 좋은 글

비슷한 주제의 글

dev.survival.log 철학과 다짐

AI한테 내 인스타 분석 맡겼더니 캐릭터가 나왔다

Everything Claude Code (ECC) 완전 가이드