Robot Foundation Model, 로봇의 GPT가 온다

내가 먼저 엿보고 온 시간들. 그 시작점은 RFM이었다.

RFM이란?

RFM(Robot Foundation Model) 은 텍스트, 비전, 행동(action) 등 다양한 멀티모달 입력을 통합하여
로봇이 상황을 이해하고, 판단하고, 스스로 움직일 수 있게 해주는 범용 인공지능 모델이다.

GPT가 언어의 뇌라면, RFM은 로봇의 시각·행동까지 포함된 진짜 두뇌라고 할 수 있다.

기존 로봇은 대부분 특정 작업만 하도록 프로그래밍되었다.
하지만 RFM은 다음과 같은 특징을 갖는다:

기존 방식: Rule-based task-specific →
RFM 기반: One-model for many-tasks

RFM은 다음과 같은 핵심 기술이 통합되어 구성된다:

현재 RFM 기술은 다음과 같은 글로벌 기업들이 선도하고 있다:

휴머노이드 비교표

이 이미지는 현재 대표적인 휴머노이드 로봇들의 스펙을 비교한 것이다.
키, 무게는 유사하지만 각 로봇의 구현 방식은 다르고, RFM이 이 차이를 결정짓는 요인이 될 가능성이 높다.

이 블로그는 RFM을 따라 미래를 엿보는 여정이다.
그리고 이 글은 그 첫 페이지.

“나는 먼저 엿보고 왔다. 그래서 기록을 남긴다.”