Figure AI Helix 02: 휴머노이드 전신 자율 제어의 전환점

Figure AI의 Helix 02가 보여준 단일 신경망 전신 제어, 109,504줄 C++ 코드 대체, 그리고 휴머노이드 로봇 산업에 대한 분석


2026년 1월 27일, Figure AI가 Helix 02를 발표했다. 기존 Helix가 상반신만 제어했다면, Helix 02는 전신을 단일 신경망으로 제어한다. 보행, 조작, 균형을 하나의 연속 시스템으로 통합한 것이다.

로보틱스 스타트업을 운영하는 입장에서, 이게 왜 중요한지 정리한다.


핵심: S0 / S1 / S2 계층 구조

Helix 02의 아키텍처는 3계층으로 나뉜다.

계층역할주파수
System 2장면 이해, 언어 해석, 행동 시퀀싱느림
System 1모든 센서 → 전신 관절 타겟 변환200Hz
System 0균형, 접촉, 전신 협응 실행1kHz

System 0이 이번 발표의 핵심이다.

  • 1,000시간 이상의 인간 모션 데이터로 학습
  • 200,000개 병렬 시뮬레이션 환경에서 강화학습 후 sim-to-real 전이
  • 10M 파라미터 신경망
  • 기존 109,504줄의 수작업 C++ 코드를 단일 신경망으로 대체

마지막 포인트가 상징적이다. 전통적 로봇 제어는 상태 머신 + PID 제어기 + 수많은 예외 처리의 조합이었다. 이걸 학습 기반 제어기 하나로 바꿨다는 것은, 로봇 제어 소프트웨어의 패러다임이 바뀌고 있다는 뜻이다.


4분 자율 주방 작업 데모

Figure AI가 공개한 데모의 내용:

  • 식기세척기 열기 → 그릇 꺼내기 → 방 횡단 이동 → 캐비닛 적재 → 식기세척기 재적재 및 작동
  • 61개 loco-manipulation 액션을 연속 수행
  • 리셋 없음, 사람 개입 없음

인상적인 디테일들:

  • 손이 차있을 때 엉덩이로 서랍 닫기, 발로 식기세척기 문 올리기 — 전신을 도구로 활용
  • 밀리미터 단위 손가락 동작 ~ 방 스케일 보행까지 4자릿수 동적 범위
  • 양손 협응 조작 (물건을 한 손에서 다른 손으로 전달)

Figure 03 하드웨어: 촉각과 손바닥 카메라

Helix 02는 Figure 03 하드웨어와 결합하여 작동한다.

  • 손바닥 카메라: 헤드 카메라에서 가려진 물체에 대한 근거리 시각 피드백 제공
  • 촉각 센서: 손끝 내장, 3g 수준의 힘 감지 (클립을 느낄 수 있는 수준)
  • 48+ 자유도

이를 통한 정밀 조작 데모 4가지:

  1. 병뚜껑 열기 — 양손 협응 + 토크 제어
  2. 약통에서 알약 1개 추출 — 손바닥 카메라 + 촉각 정밀 그립
  3. 주사기 5ml 정밀 배출 — 힘 제어 + 촉각 피드백
  4. 어수선한 상자에서 금속 부품 꺼내기 — 시각 + 촉각 확인

특히 4번은 Figure의 실제 BotQ 제조시설에서 사용되는 금속 부품으로 데모한 것이다.


Figure AI 현황

항목내용
누적 투자~$1.9B
기업가치$39B (2025.09 Series C)
18개월 가치 성장15배 ($2.6B → $39B)
주요 투자자NVIDIA, Intel Capital, Qualcomm, Salesforce, LG 등
생산시설BotQ — 연 12,000대 Figure 03 생산 목표
상용 배치BMW 스파르탄버그 공장, 30,000대 X3 생산 기여

BMW 배치에서는 Figure 02가 10시간 교대근무로 1,250시간 이상 가동하며 시트메탈 pick-and-place 작업을 수행했다. 이 데이터가 Figure 03 설계에 반영되었다.


경쟁 환경

기업제품핵심 차별점2026 상태
Figure AIFigure 03 + Helix 02End-to-end 신경망 전신 제어, 촉각상용 배치 진행 중
TeslaOptimus Gen 3수직통합, 대량생산 (100만대/년 목표)$25K 이하 목표, 2027 판매 예정
Boston DynamicsElectric Atlas산업용 고성능, 엔터프라이즈 등급CES 2026 공개
1XNEO가정용 특화, $20K2026 첫 배송 예정
UnitreeH1/G1가격 경쟁력, 2025년 5,500대 출하2026년 20,000대 목표

주목할 점: Unitree가 2025년 출하량 기준으로 미국 경쟁사들(Tesla, Figure, Agility)의 합산을 넘어섰다. 중국발 물량 경쟁은 이미 시작되었다.


냉정한 평가

인상적인 것:

  • Locomotion + Manipulation을 분리하지 않고 단일 시스템으로 통합한 실질적 데모
  • 109,504줄 수작업 C++ → 학습 기반 제어기 전환의 상징적 사례
  • 촉각 + 손바닥 카메라의 실제 활용 증명

주의해야 할 것:

  • 데모는 통제된 환경(자체 주방)에서 수행 — 일반 가정이나 비정형 환경에서의 일반화 성능은 미검증
  • “최장 자율 작업”이라는 주장은 자사 기준이며, 독립적 검증은 없음
  • 4분 61개 액션은 인상적이지만, 인간 수준(수시간 연속, 수천 가지 예외 처리)과는 여전히 큰 격차
  • 실패율, 재현율 등 정량적 성능 지표가 공개되지 않음
  • BMW 파일럿은 pick-and-place라는 비교적 단순한 작업이었고, Helix 02의 정밀 조작이 실제 산업 환경에서 얼마나 robust한지는 별개 문제

WIM 관점에서의 시사점

Figure AI가 보여준 것은 학습 기반 전신 제어의 가능성이다. 109,504줄의 C++ 코드가 신경망으로 대체된다는 것은, 전통적 로봇 제어 엔지니어링의 가치가 빠르게 변하고 있다는 의미다.

하지만 이것이 곧 “모든 로봇 제어가 end-to-end 학습으로 갈 것”이라는 뜻은 아니다. Figure AI의 케이스는 대규모 자본($1.9B)과 데이터(1,000시간 모션 데이터, 200K 병렬 시뮬레이션)가 있기에 가능한 접근이다.

우리처럼 자원이 제한된 팀에게 핵심 질문은: 어떤 수준의 학습 기반 제어를 우리 규모에서 적용할 수 있는가?


참고 자료:

← All posts