NVIDIA GTC 3일차 — 에이전틱 제품과 뉴럴넷, 두 갈래 전략

GTC 현장에서 팀원과 나눈 대화. 소프트웨어 스택을 파는 시대에서 에이전틱 직원을 파는 시대로, 그리고 진짜 경쟁력은 자체 신경망에 있다는 이야기.


GTC 3일차, 팀원 동빈이와 걸으면서 나눈 이야기를 정리한다.

소프트웨어 스택이 아니라 에이전틱 직원을 판다

우리 윈팩을 보면 각 소프트웨어 스택별로 기능이 나뉘어 있다. RT 담당, 통신 프로토콜 담당, 이런 식으로. 근데 나는 앞으로 이 각각의 스택이 하나의 에이전트 — 즉 직원이 된다고 본다.

그러니까 우리가 고객에게 주는 건 소프트웨어 스택이 아니라, 그 스택을 알아서 관리하는 에이전틱 직원이다. 우리 제품을 사면 그 안에 여러 에이전트가 있고, 이걸 통합 관제하는 에이전트 — 팀장이 있는 구조다. 팀장 아래에 RT 담당, 프로토콜 담당 등 세부 에이전트들이 필요한 걸 가져오고, 만들어내고, 정보를 요청한다.

마케팅도 이 방향으로 바뀌어야 한다. “소프트웨어 스택을 드립니다”가 아니라 **“에이전틱 직원을 드립니다”**로.

R&D와 세일즈는 다른 방향을 봐야 한다

여기서 중요한 건 제품 판매 방향과 R&D 방향이 다르다는 점이다.

세일즈/제품 쪽은 에이전틱 컨트롤러로 가는 게 맞다. 고객이 쉽게 쓸 수 있는 에이전트 기반 인터페이스. OpenPro처럼 좀 더 쉽게 풀어낸 형태.

R&D/기술 경쟁력 쪽은 자체 뉴럴넷 모델이다. 회사가 인수를 당하든 IPO를 하든, 가장 중요한 기술 지표는 이 신경망이다. 클로드코드가 아무리 발전해도 이 영역은 대체 불가다.

규칙을 주는 시대에서 학습시키는 시대로

예전엔 동빈이한테 “이 경우엔 이렇게 해, 저 경우엔 저렇게 해” 식으로 규칙을 다 줬다. 알고리즘, 메소드라고 부르는 것들. 안을 들여다보면 대부분 수학식이거나 if-else 조건문이다.

이제는 다르다. 규칙을 명시적으로 알려주는 게 아니라, 이걸 했을 때 칭찬하고 저걸 했을 때 벌을 주다 보면 직관적으로 체득하게 된다. 자기 보상을 최대화하는 방향으로 행동이 수렴하는 것. 이게 신경망이고, 이게 강화학습이다.

에이전트의 근본적 한계: 눈이 없다

텍스트 기반 에이전트는 눈이 없다. 그래서 물리 세계에서 뭐가 맞고 뭐가 틀린지, 실험 결과는 인간이 계속 알려줘야 한다.

구체적인 예시를 들어보자. 로봇 팔을 올리는 상황. 에이전트 입장에선 팔의 무게, 관절 토크를 완벽하게 계산해서 올렸다. 근데 동빈이가 옷을 입고 있고 시계를 차고 있다. 에이전트는 그걸 못 본다. 팔이 계산대로 안 올라가는데, 왜 안 올라가는지 에이전트는 모르는 거다.

이게 바로 VLA(Vision-Language-Action) 모델이 풀어야 할 문제다. LLM과 비전과 모터 토크를 합친 모델. 이걸 학습시키려면 시뮬레이션에서 데이터를 확보하고, 실험을 정말 많이 해서 신경망에 넣어야 한다. 에이전트가 대신 해줄 수 없는 영역이다 — 눈이 없으니까.

결론: 투트랙

방향핵심
세일즈에이전틱 컨트롤러고객에게 “에이전틱 직원”을 판다
R&D자체 뉴럴넷 (강화학습/VLA)이게 회사의 진짜 기술 경쟁력

제품은 에이전트로 포장하고, 기술의 핵심은 자체 신경망으로 쌓는다. 지금 희우가 Google 로봇 발레 기반으로 강화학습을 하고 있는데, 여기에 사람을 더 투자하는 게 맞다.

한 줄 결론: 고객에겐 에이전틱 직원을 팔고, 우리의 해자는 자체 뉴럴넷으로 판다.

← All posts