로봇이 세상을 배우는 방식이 달라지고 있다. 복잡한 물리 엔진과 사람이 직접 짜 넣은 동역학 코드 대신, 방대한 인간 행동 데이터가 그 자리를 대체하기 시작했다. NVIDIA가 공개한 오픈소스 월드 모델 ‘DreamDojo’는 그 전환의 신호탄이라고 할 수 있다.
이 프로젝트의 발상은 단순하다. 로봇에게 세상의 법칙을 공식으로 설명하는 대신 4만4천 시간에 달하는 1인칭 인간 비디오를 보여준다. 걷고, 집고, 옮기고, 실패하는 장면까지 포함된 일상의 축적이다. 모델은 이 데이터를 바탕으로 “행동하면 다음 장면이 어떻게 바뀌는지”를 학습한다. 모터 제어 신호가 입력되면, 신경망이 픽셀 단위로 미래를 그려낸다. 전통적 시뮬레이션을 예측 모델이 대체하는 구조다.
