brunch

14. 고수준(High-level) 계획

3장 현재까지의 로봇들

by AI개발자
physicalai-멀티모달AI와-로봇-top2.png

이미지, 음성, 깊이(Depth) 등 다양한 센서 정보를 활용해 현재 상황을 로봇이 이해하기 쉬운 형태로 변환합니다. 이러한 정보를 기반으로 로봇은 주어진 작업을 어떻게 실행할지, 또는 큰 작업을 어떤 방식으로 세부단게(서브태스크)로 나눌지를 결정해야 합니다. 이를 위해서는 고수준 작업 계획(High-level Task Planning)이 필요합니다.


⑴ 고수준 계획의 방법

로봇이 "무엇을, 어떤 순서로 수행할 것인가"를 결정하는 것이 작업 계획(Task Planning)입니다. 이 단계에서는 센서나 제어신호보다 의도/순서/조건 같은 추상적인 수준의 의사결정이 중심이 됩니다. 고수준 계획은 전통적으로 다음 4가지 접근을 중심으로 발전해왔습니다.


유한상태기계(FSM)

그래프 기반 계획 (Graph-based Planning)

계획 기술 언어 (PDDL)

계층형 태스크 네트워크 (HTN)

ai-robot056.jpg


① 유한상태기계 (FSM, Finite State Machine)

FSM은 로봇의 동작을 여러 "상태(State)"로 나누고, 각 상태 간의 전환 조건(Transition)을 정의하여 행동 흐름을 제어하는 방식입니다. 예를 들어,


[대기] → (명령 입력) → [이동] → (도착 확인) → [작업 수행] → [종료]


이처럼 각 상태를 전이 규칙으로 연결하면 단순하면서도 명확한 행동 제어가 가능합니다.


장점

구조가 단순하고 구현이 쉬움

동작의 예측 가능성과 디버깅 용이성

한계

상태가 많아질수록 복잡도 급증

새로운 상황 추가 시 재설계 필요

이 한계를 보완하기 위해 행동트리(Behavior Tree)상태트리(State Tree) 같은 유연한 확장형 구조가 개발되고 있습니다. 이들은 최근 게임 AI, 서비스 로봇제어등에서도 널리 사용됩니다.


② 그래프 기반 계획 (Graph-based Planning)

그래프 기반 계획은 문제공간을 노드(상태)엣지(전이)로 구성하고, 목표까지의 경로를 탐색하는 방식입니다.


주요 알고리즘:

다익스트라(Dijkstra): 모든 경로 중 최소 비용 경로 탐색

A*: 휴리스틱(Heuristic)을 추가하여 탐색 효율을 높인 방식

이 방법은 자율주행 로봇의 경로탐색, 드론 비행경로 최적화 등에서 표준적으로 사용됩니다.


장점

명확한 목표 기반의 최적 계획 가능

수학적 안정성과 검증 용이

한계

3차원 또는 고차원 공간에서는 계산량 급증

실시간 변화 대응이 어려움


③ 계획 기술 언어 (PDDL, Planning Domain Definition Language)

PDDL은 작업 계획을 위해 고안된 형식적 언어(Planning Language)입니다. 문제를 '도메인(Domain)'과 '문제(Problem)'로 분리해 정의합니다.

ai-robot055.jpg

예를 들어,

도메인: "물체를 잡을 수 있다(Grasp), 옮길 수 있다(Move)"

문제: "컵이 테이블 위에 있고, 선반 위로 옮겨야 한다"

PDDL 기반의 대표 알고리즘은 Fast Downward등이며, 복잡한 작업 절차를 자동으로 계획할 수 있다는 점이 강점입니다.


장점

추상적 수준의 자동 계획 생성 가능

명시적 규칙 기반이라 해석/검증이 쉬움

한계

도메인 지식 구축에 많은 인력 필요

문제 크기가 커지면 계산 부하 급증

실시간 반응성 부족


④ 계층형 태스크 네트워크 (HTN, Hierarchical Task Network)

HTN은 복잡한 작업을 여러 하위 작업(subtask)으로 계층적으로 분할해 계획하는 방식입니다. 즉, "큰 목표를 작은 단계로 나누어 실행하는 구조"입니다.

예를 들어,

목표: "책상을 정리한다"

서브태스크1: "책을 정리한다"

서브태스크2: "컵을 치운다"

서브태스크3: "책상을 닦는다"

대표 알고리즘: SHOP2(Simple Hierarchical Ordered Planner 2)


장점

복잡한 다단계 작업을 체계적으로 구성 가능

실제 로봇 작업 절차(예: 조립, 요리 등)에 자연스럽게 대응

한계

태스크 간 정합성 유지와 순서 제어가 중요

설계복잡도가 높음


- 공통적 틍징 및 한계

ai-robot057.jpg


- 최근변화: LLM과의 결합

최근에는 LLM(대규모 언어 모델)이 기존의 계획기술(PDDL, HTN등)을 보완 및 대체하는 흐름이 빠르게 확산되고 있습니다.

LLM은 자연어로 주어진 목표를 해석하고, 태스크를 순차적 단계로 자동 분해할 수 있습니다.

기존 PDDL/HTN을 프롬프트 형태로 통합하거나, 자연어 → 계획코드 변환(예: "코드로서의 정책", Code-as-Policies)도 가능해졌습니다.

결과적으로 고수준 계획은 "명시적 모델링 중심"에서 "언어적 추론 중심"으로 변화하고 있습니다.


ai-robot058.jpg


전통적인 고수준 계획 기법은 여전히 유효하지만, 이제는 LLM을 통해 지식표현과 계획 생성이 융합되는 단계로 진화하고 있습니다. 로봇이 "명시된 규칙을 따르는 존재"에서 '의미를 이해하고 스스로 판단하는 존재"로 바뀌고 있는 것입니다.



©2024-2025 MDRULES.dev, Hand-crafted & made with Jaewoo Kim.

이메일문의: jaewoo@mdrules.dev


AI 에이전트 개발, 컨텍스트 엔지니어링 교육 컨설팅, 바이브코딩 강의 문의: https://bit.ly/4kjk5OB


keyword
이전 13화13. 고수준(High-Level) 인식