메타ai뉴스 이현우 교수칼럼
생성형 AI의 다음 단계, ‘행동하는 지능’이 온다: 피지컬 인텔리전스의 도약과 시사점

글로벌연합대학 버지니아대학교
인공지능융합연구소장 이현우 교수
인공지능(AI)의 발전 속도가 가히 경이롭습니다. 챗GPT로 대표되는 생성형 AI가 인간의 ‘언어’와 ‘창작’ 영역을 혁신했다면, 이제 그 기술의 파고는 물리적 실체를 가진 로봇, 즉 ‘행동’의 영역으로 급격히 이동하고 있습니다. 최근 로봇 AI 스타트업 ‘피지컬 인텔리전스(Physical Intelligence)’가 설립 1년여 만에 무려 8조 원(56억 달러)의 기업 가치를 인정받았다는 소식은 단순한 투자 뉴스가 아닙니다. 이는 AI 산업의 축이 ‘생각하는 AI’에서 ‘움직이는 AI’, 즉 엠바디드 AI(Embodied AI)로 이동하고 있음을 알리는 거대한 신호탄입니다.
구글 딥마인드 출신의 석학들과 실리콘밸리의 거대 자본이 왜 지금 이 시점에 ‘범용 로봇 지능’에 주목하는지, 그리고 이것이 우리에게 시사하는 바는 무엇인지 깊이 있는 분석이 필요한 시점입니다.
[이슈 분석] ‘언어’를 넘어 ‘물리’적 세계로 진입하는 AI
이번 피지컬 인텔리전스의 대규모 투자 유치와 기술적 성과는 세 가지 핵심적인 이슈를 내포하고 있습니다. 이는 로봇 산업의 패러다임 전환, 데이터 학습 방식의 논쟁, 그리고 생산성 혁명이라는 관점에서 해석될 수 있습니다.
- ‘범용 로봇 지능(General Physical Intelligence)’의 부상 핵심 이슈는 ‘하드웨어 종속성’의 탈피입니다. 지금까지의 로봇 소프트웨어는 특정 로봇 팔, 특정 이동 장치에 맞춰 커스터마이징된 ‘전용 지능’이었습니다. 그러나 피지컬 인텔리전스가 추구하는 것은 마치 안드로이드 OS가 다양한 스마트폰에 탑재되듯, 어떤 로봇이나 장치에도 적용 가능한 ‘범용 두뇌(Brain)’를 만드는 것입니다. 기업 가치가 1년 만에 3배 가까이 급등한 배경에는 이러한 ‘범용성’에 대한 시장의 기대가 깔려 있습니다. 만약 하나의 AI 모델로 물류 창고의 로봇 팔부터 가정용 가사 로봇까지 모두 제어할 수 있다면, 이는 하드웨어 중심의 로봇 산업을 소프트웨어 중심의 플랫폼 산업으로 재편하는 결과를 낳을 것입니다.
- ‘시뮬레이션’ 대 ‘현실 데이터’: 학습 방법론의 승부 기술적 관점에서 가장 주목해야 할 대목은 이들의 데이터 접근 방식입니다. 현재 AI 로봇 학계의 한 축은 가상 환경에서 시뮬레이션을 통해 데이터를 생성하고 학습하는 ‘월드 모델(World Model)’ 접근법을 선호합니다. 비용이 저렴하고 데이터 생성 속도가 빠르기 때문입니다. 하지만 피지컬 인텔리전스는 ‘실제 세계(Real World)’에서 수집한 데이터 중심의 검증된 방식을 고수하고 있습니다.
가상 시뮬레이션이 놓칠 수 있는 미세한 마찰력, 질감, 예측 불가능한 물리적 변수들을 직접 학습하겠다는 의지입니다. 이는 “로봇은 결국 현실에서 작동해야 한다”는 본질을 꿰뚫은 것으로, 높은 비용을 감수하더라도 ‘신뢰성’과 ‘정교함’을 확보하겠다는 전략적 선택입니다.
- 시각 지능과 행동의 결합: 파이(π) 모델의 등장 이들이 공개한 AI 비전 모델 ‘π*0.6’은 시각 정보 처리와 행동 제어가 어떻게 융합되어야 하는지를 보여줍니다. 강화 학습(Reinforcement Learning)을 적용하여 로봇이 스스로 시행착오를 통해 최적의 동작을 찾아내게 함으로써, 기존 대비 생산성을 2배 이상 높였다는 점은 고무적입니다. 특히 옷을 개거나 상자를 조립하는 것과 같은 비정형 작업은 기존의 프로그래밍 방식으로는 구현이 매우 까다로운 영역이었습니다. 이를 평균 2~3분 내에 안정적으로 수행해냈다는 것은 로봇이 단순 반복 작업을 넘어 복잡한 인지 작업이 필요한 영역으로 진입했음을 의미합니다.
‘피지컬 AI’ 시대를 대비하는 우리의 전략
피지컬 인텔리전스의 사례는 국내 AI 및 로봇 산업계, 그리고 연구자들에게 명확한 과제를 던져줍니다. 우리가 글로벌 기술 경쟁에서 도태되지 않고 주도권을 잡기 위해서는 다음과 같은 구체적인 실천 방안이 모색되어야 합니다.
- ‘하이브리드 데이터 파이프라인’ 구축 AI 모델 개발에 있어 데이터 전략을 재정비해야 합니다. 피지컬 인텔리전스의 사례에서 보듯, 현실 데이터의 중요성은 아무리 강조해도 지나치지 않습니다. 국내 기업과 연구소는 시뮬레이션의 효율성을 활용하되, 반드시 실제 물리 환경에서의 ‘Real-World Data’를 지속적으로 확보하고 검증하는 하이브리드 파이프라인을 구축해야 합니다. 로봇이 활동할 실제 현장(공장, 물류 센터, 가정 등) 데이터를 체계적으로 수집하고, 이를 AI 모델에 피드백하는 루프(Loop)를 만드는 것이 기술 격차를 줄이는 핵심 열쇠가 될 것입니다.
- 비전-행동 융합 모델(VLA) 연구 강화 단순히 보는 것(Vision)과 언어를 이해하는 것(Language)을 넘어, 이를 행동(Action)으로 연결하는 VLA(Vision-Language-Action) 모델 연구에 박차를 가해야 합니다. ‘π*0.6’ 모델과 같이 시각 정보를 통해 상황을 인지하고, 강화 학습을 통해 최적의 물리적 제어를 수행하는 알고리즘 개발이 필요합니다. 이를 위해 AI 연구자와 로봇 제어 공학자 간의 칸막이를 없애고, 소프트웨어와 하드웨어가 유기적으로 결합된 융합 연구 프로젝트를 국가적 차원에서 지원해야 합니다.
- 틈새 시장을 노리는 ‘특화형 범용 지능’ 개발 글로벌 빅테크가 막대한 자본으로 ‘완전한 범용 지능’을 노린다면, 우리는 특정 도메인에 특화되면서도 범용성을 가진 ‘버티컬 AI’ 전략을 구사할 필요가 있습니다. 예를 들어, 한국이 강점을 가진 ‘제조업’이나 ‘노인 돌봄’ 분야에 특화된 로봇 지능을 우선적으로 개발하여 상용화 성공 사례를 만드는 것입니다. 특정 환경(예: 반도체 공정, 병원 간호) 내에서는 어떤 로봇 하드웨어에도 적용 가능한 표준 운영체제를 선점하는 것이 현실적이고 효과적인 전략이 될 수 있습니다.
- 윤리적 가이드라인과 안전 기준 선제적 마련 LLM이 잘못된 정보를 말하는 것은 수정하면 되지만, 로봇이 잘못된 행동을 하는 것은 물리적 파괴나 인명 피해로 이어질 수 있습니다. 따라서 로봇 AI 기술 개발 단계에서부터 ‘물리적 안전(Physical Safety)’을 최우선으로 하는 윤리적 가이드라인과 기술적 안전 장치(Kill Switch 등)를 함께 설계해야 합니다. 이는 향후 글로벌 시장 진출 시 강력한 경쟁력이 될 수 있는 ‘신뢰할 수 있는 AI(Trustworthy AI)’의 기반이 될 것입니다.
결론적으로, 피지컬 인텔리전스의 도약은 AI가 모니터 밖으로 나와 우리의 현실 세계를 직접 변화시키는 시점이 도래했음을 알리고 있습니다. 이제 우리는 ‘말 잘하는 AI’를 넘어 ‘일 잘하는 AI’를 준비해야 합니다. 하드웨어의 한계를 소프트웨어의 지능으로 극복하고, 현실 데이터에 기반한 견고한 기술력을 쌓아가는 것, 그것이 다가올 로봇 공존 시대에 우리가 가져야 할 경쟁력의 본질입니다.
편집위원 이현우교수
heir201933@gmail.com