YOR: $10K로 만드는 오픈소스 모바일 매니퓰레이터
NYU 연구팀이 공개한 YOR(Your Own Robot) — $9,200 BOM, 완전 오픈소스, 양팔 6-DOF 모바일 매니퓰레이터의 설계와 의미
2026년 2월 11일, NYU와 UC Berkeley 연구팀이 YOR(Your Own Robot)을 공개했다. 옴니디렉셔널 모바일 베이스, 수직 리프트, 양팔 6-DOF 매니퓰레이터를 $9,200 BOM으로 조립할 수 있는 완전 오픈소스 플랫폼이다.
주목할 점은 팀 구성이다. 공동 어드바이저에 Soumith Chintala(PyTorch 창시자, Meta AI Research VP)와 Lerrel Pinto(NYU 로봇 학습 연구실)가 있다. 아카데미아의 장난감 수준이 아니라, 실제 연구 인프라로 쓸 의도로 만든 플랫폼이라는 뜻이다.
왜 이게 중요한가
모바일 매니퓰레이션 연구의 가장 큰 병목은 하드웨어 비용이었다. 현재 시장 상황:
| 플랫폼 | 가격 | 팔 | 리프트 | 옴니 | 오픈소스 |
|---|---|---|---|---|---|
| YOR | ~$9.2K | 2 × 6-DOF | ✓ | ✓ | ✓ |
| TidyBot++ | ~$5-6K | 1 × 7-DOF | ✗ | ✓ | ✓ |
| Mobile ALOHA | ~$32K | 2 × 6-DOF | ✗ | ✗ | ✓ |
| Stretch RE2 | ~$25K | 1 × 5-DOF | ✓ | ✗ | 부분 |
| RB-Y1 (Rainbow) | ~$100K | 1 | ✓ | ✓ | ✗ |
YOR이 유일하게 양팔 + 리프트 + 옴니디렉셔널 이동을 $10K 미만에서 제공한다. TidyBot++이 더 싸지만 단일 팔이고 리프트가 없다. Mobile ALOHA는 양팔이지만 3배 이상 비싸고 비홀로노믹(전방향 이동 불가)이다.
하드웨어 설계
모바일 베이스: Swerve Drive
FRC(FIRST Robotics Competition) 로봇에서 빌려온 설계다. REV Robotics MAXSwerve 모듈 4개를 사용한다.
- 각 모듈: NEO 550(조향) + NEO Vortex(구동), $625/개
- 풋프린트: 43 × 34.5cm — 가정용 문을 통과할 수 있는 크기
- 최대 이론 속도: 1.5m/s (소프트웨어 제한: 0.25m/s)
- 옴니디렉셔널 이동: 제자리 회전, 측면 이동 가능
“최단 회전” 최적화가 있다. 바퀴가 90도 이상 회전해야 하면 구동 방향을 반전시켜 최대 회전각을 90도로 제한한다. 사소해 보이지만 실제 응답성에 큰 차이를 만든다.
수직 리프트: 스탠딩 데스크 해킹
가장 영리한 설계 결정이다. FLEXISPOT E6 스탠딩 데스크용 리프트를 그대로 가져왔다.
- 스트로크: 0.6 ~ 1.24m (작업 높이 조절)
- 최대 속도: 35mm/s
- 자기잠금 기능: 전원 꺼져도 위치 유지
- 제어: Raspberry Pi Pico + BTS7960 H-bridge
$180짜리 상용 부품으로 안정적인 수직 자유도를 확보한 것이다. 커스텀 리니어 액추에이터를 설계하면 비용이 몇 배로 뛰었을 것이다.
팔: AgileX PiPER × 2
- 6-DOF, $2,500/개, 4.2kg
- 어깨 45도 외향 틸트 → 두 팔 간 충돌 회피 + 전체 폭 축소
- 관절 강성 컨트롤러: 중력 보상 피드포워드 + PD 제어
- 저수준 제어 200Hz (Ruckig 궤적 생성)
그리퍼는 커스텀 설계로, iPhone 센서 스위트를 내장해 근접 시각 피드백을 제공한다.
컴퓨트
- 메인: Raspberry Pi 5 (16GB) — $80
- SLAM 옵션: Jetson Orin NX + ZED 2i 스테레오 카메라 — ~$1,600 추가
- 총 BOM: $9,207.52 (SLAM 포함 시 ~$10,800)
팔이 전체 비용의 55%($5,054)를 차지한다. 팔 가격이 내려가면 전체 BOM도 급격히 내려갈 구조다.
소프트웨어 스택
텔레오퍼레이션: Meta Quest 3
- Quest 컨트롤러 자세 → 팔 엔드이펙터 자세로 실시간 매핑
- 리프트: 버튼 제어 (위/아래 속도)
- 베이스: 조이스틱으로 선속도/각속도 제어
- HMD 착용 불필요 — 로봇 뒤에 서서 직접 시야 확보 가능
SLAM + 자율 내비게이션
ZED 2i 스테레오 카메라 기반 파이프라인:
- Visual-Inertial SLAM으로 로봇 SE(3) 자세 추정
- 포인트 클라우드 → 복셀 맵 (0.02m 해상도, 5Hz)
- 가중치 A* 경로 계획 + Pure Pursuit 추종 (50Hz)
- 동적 장애물 감지 시 1초 내 경로 재계획
위치 정확도: 루프 폐쇄 테스트에서 12mm 반경 내 수렴, SLAM 파이프라인 50mm 정확도.
정책 학습: VQ-BeT
모방 학습(imitation learning) 프레임워크를 탑재했다.
- 입력: 손목 카메라 2개 + 헤드 카메라 + 고유감각 (19차원 행동 공간)
- 아키텍처: ResNet-50 인코더 + Transformer 디코더
- 재활용 태스크 실험: 100개 시연으로 학습, 9/10 전체 성공률
19차원 행동 공간이 주목할 만하다: 팔당 7D 엔드이펙터 + 그리퍼 + 베이스 병진 + 기저 방향 + 리프트 높이. 전신(whole-body) 제어를 단일 정책으로 학습한 것이다.
실험 결과
재활용 태스크
큰 판지 상자를 양손으로 집어서 장애물을 피해 이동한 뒤 재활용함에 넣는 과제:
| 단계 | 성공률 |
|---|---|
| 상자 집기 | 10/10 |
| 들어올리기 | 10/10 |
| 장애물 회피 이동 | 9/10 |
| 전체 | 9/10 |
실패 원인: 이동 중 카메라 폐색으로 인한 오도메트리 드리프트.
전신 협응 제어
베이스가 측면으로 이동하면서 팔이 월드 프레임 기준으로 고정점을 유지하는 테스트에서 엔드이펙터 편차 16mm를 달성했다. 이 정도면 실용적 수준이다.
텔레오퍼레이션 데모
웹사이트에 공개된 가정 환경 데모 9개:
- 식기세척기 적재
- 화분 물주기
- 세탁물 수거
- 재활용 분류
- 탁자 정리 등
양팔 + 리프트 + 이동을 동시에 사용하는 복합 태스크들이다.
냉정한 평가
잘 한 것:
- 설계 철학이 명확하다. “최소 비용으로 최대 자유도”라는 원칙에 충실하다. 스탠딩 데스크 리프트, FRC 로봇 바퀴, $80 Raspberry Pi — 모두 검증된 상용 부품을 조합한 실용적 접근이다.
- 완전 오픈소스. CAD, BOM, 소프트웨어, 빌드 가이드까지 전부 공개했다. 재현 가능한 연구를 실제로 가능하게 만든다.
- 전신 제어를 $10K에서 실현했다. 양팔 + 리프트 + 옴니베이스 조합을 이 가격대에서 제공하는 플랫폼은 없었다.
주의할 점:
- 6-DOF 팔의 한계. 논문에서도 특이점(singularity) 문제를 인정한다. 7-DOF로의 교체를 향후 과제로 언급했지만, 현재 가격대에서 7-DOF 팔은 비용을 상당히 올릴 것이다.
- 리프트 속도 35mm/s. 스탠딩 데스크 리프트의 태생적 한계다. 빠른 수직 이동이 필요한 태스크에서는 병목이 된다.
- 컴퓨트가 Raspberry Pi 5. 추론 속도에 한계가 있다. 실시간 비전 정책을 실행하려면 결국 Jetson 같은 GPU 컴퓨트가 필요하고, 그러면 BOM이 $10K를 넘는다.
- 실험 규모가 작다. 재활용 태스크 1개, 10회 시행. Figure AI의 61개 연속 액션과 비교하면 검증 범위가 제한적이다. 물론 $10K 플랫폼과 $39B 기업가치 회사를 직접 비교하는 것은 공정하지 않다.
- 페이로드 미공개. 얼마나 무거운 물건을 다룰 수 있는지에 대한 정량적 데이터가 없다. PiPER 팔의 payload는 공식 스펙 기준 ~1.5kg으로, 실제 가정 환경에서의 활용 범위를 제한할 수 있다.
맥락: 오픈소스 모바일 매니퓰레이터의 계보
YOR은 갑자기 등장한 것이 아니다. 최근 1-2년간 저비용 오픈소스 로봇 플랫폼의 흐름이 있다:
- ALOHA / Mobile ALOHA (Stanford, 2023-24): 양팔 텔레오퍼레이션 → 모방 학습의 표준 파이프라인을 확립
- TidyBot++ (Princeton/Stanford, 2024): 홀로노믹 모바일 베이스 + 단일 팔, ~$5-6K
- LeRobot / XLeRobot (Hugging Face, 2024-25): 초저가($200-) 로봇 팔 플랫폼
YOR은 이 흐름에서 양팔 + 리프트 + 옴니베이스의 조합이라는 빈 자리를 채웠다. 가격은 TidyBot++보다 높지만, 기능적으로는 가장 완성도 높은 오픈소스 모바일 매니퓰레이터다.
WIM 관점
YOR이 WIM에 직접적으로 유용한 것은 아니다. 우리는 산업용 로봇 제어 솔루션을 만들고 있고, $9K 연구 플랫폼과는 목표가 다르다.
하지만 읽어야 할 신호가 있다:
- 하드웨어 상품화가 가속되고 있다. $2,500짜리 6-DOF 팔, $625짜리 swerve 모듈, $80 컴퓨트. 하드웨어 자체의 가치는 빠르게 0으로 수렴하고 있다. 가치는 소프트웨어와 제어에 있다.
- 전신 제어(whole-body control)가 새로운 기본 요구사항이 되고 있다. YOR, Figure AI, TidyBot++ 모두 이동 + 조작을 통합 제어하는 방향으로 가고 있다. 팔만 따로 제어하는 시대는 끝나가고 있다.
- 오픈소스 생태계가 연구 인프라를 바꾸고 있다. $100K 플랫폼을 살 수 없던 랩들이 $10K로 연구를 시작할 수 있게 되면, 모바일 매니퓰레이션 연구의 총량이 폭발적으로 늘어난다. 그 연구 결과의 수혜자는 우리 같은 솔루션 기업이다.
참고 자료:
← All posts