이 강의는 Agentic Retrieval-Augmented Generation (Agentic RAG)에 대한 포괄적인 개요를 제공합니다. 이는 대규모 언어 모델(LLM)이 외부 소스로부터 정보를 가져오면서 다음 단계를 자율적으로 계획하는 AI의 새로운 패러다임입니다. 정적 검색 후 읽기 패턴과 달리, Agentic RAG는 도구나 함수 호출 및 구조화된 출력을 포함한 반복적인 LLM 호출을 특징으로 합니다. 시스템은 결과를 평가하고, 쿼리를 개선하며, 필요시 추가 도구를 호출하고, 만족스러운 솔루션이 나올 때까지 이 과정을 반복합니다.
이 강의에서는 다음 내용을 다룹니다:
- Agentic RAG 이해하기: 대규모 언어 모델(LLM)이 외부 데이터 소스에서 정보를 가져오면서 다음 단계를 자율적으로 계획하는 AI의 새로운 패러다임에 대해 학습합니다.
- 반복적 Maker-Checker 스타일 익히기: LLM 호출과 도구 또는 함수 호출 및 구조화된 출력이 반복되는 루프를 이해하며, 이는 정확성을 개선하고 잘못된 쿼리를 처리하도록 설계되었습니다.
- 실용적 응용 탐구: 정확성 우선 환경, 복잡한 데이터베이스 상호작용, 확장된 워크플로우와 같은 상황에서 Agentic RAG가 빛을 발하는 사례를 확인합니다.
이 강의를 완료하면 다음을 알게 됩니다:
- Agentic RAG 이해: 대규모 언어 모델(LLM)이 외부 데이터 소스에서 정보를 가져오면서 다음 단계를 자율적으로 계획하는 AI의 새로운 패러다임에 대해 학습합니다.
- 반복적 Maker-Checker 스타일: LLM 호출과 도구 또는 함수 호출 및 구조화된 출력이 반복되는 루프의 개념을 이해하며, 이는 정확성을 개선하고 잘못된 쿼리를 처리하도록 설계되었습니다.
- 추론 과정 소유하기: 시스템이 사전 정의된 경로에 의존하지 않고 문제를 해결하는 방법을 결정하는 능력을 이해합니다.
- 워크플로우: 에이전트 모델이 독립적으로 시장 동향 보고서를 검색하고, 경쟁사 데이터를 식별하며, 내부 판매 지표를 상관시키고, 결과를 종합하고, 전략을 평가하는 과정을 이해합니다.
- 반복적 루프, 도구 통합 및 메모리: 시스템이 반복적 상호작용 패턴에 의존하며, 상태와 메모리를 유지하여 반복 루프를 피하고 정보에 입각한 결정을 내리는 방법을 학습합니다.
- 실패 모드 처리 및 자기 수정: 진단 도구를 사용하거나 인간 감독에 의존하는 등 시스템의 강력한 자기 수정 메커니즘을 탐구합니다.
- 에이전시의 한계: 도메인별 자율성, 인프라 의존성, 안전 장치 준수를 중심으로 Agentic RAG의 한계를 이해합니다.
- 실용적 사용 사례 및 가치: 정확성 우선 환경, 복잡한 데이터베이스 상호작용, 확장된 워크플로우와 같은 상황에서 Agentic RAG가 빛을 발하는 사례를 확인합니다.
- 거버넌스, 투명성, 신뢰: 설명 가능한 추론, 편향 제어, 인간 감독 등 거버넌스와 투명성의 중요성을 학습합니다.
Agentic Retrieval-Augmented Generation (Agentic RAG)은 대규모 언어 모델(LLM)이 외부 소스로부터 정보를 가져오면서 다음 단계를 자율적으로 계획하는 AI의 새로운 패러다임입니다. 정적 검색 후 읽기 패턴과 달리, Agentic RAG는 도구나 함수 호출 및 구조화된 출력을 포함한 반복적인 LLM 호출을 특징으로 합니다. 시스템은 결과를 평가하고, 쿼리를 개선하며, 필요시 추가 도구를 호출하고, 만족스러운 솔루션이 나올 때까지 이 과정을 반복합니다. 이러한 반복적인 "maker-checker" 스타일은 정확성을 개선하고, 잘못된 쿼리를 처리하며, 높은 품질의 결과를 보장합니다.
시스템은 추론 과정을 적극적으로 소유하며, 실패한 쿼리를 다시 작성하거나, 다른 검색 방법을 선택하고, 여러 도구(예: Azure AI Search의 벡터 검색, SQL 데이터베이스, 사용자 지정 API)를 통합하여 최종 답변을 도출합니다. 에이전틱 시스템의 차별화된 품질은 추론 과정을 스스로 소유하는 능력입니다. 기존 RAG 구현은 사전 정의된 경로에 의존하지만, 에이전틱 시스템은 발견된 정보의 품질에 따라 단계의 순서를 자율적으로 결정합니다.
Agentic Retrieval-Augmented Generation (Agentic RAG)은 LLM이 외부 데이터 소스에서 정보를 가져오는 것뿐만 아니라, 다음 단계를 자율적으로 계획하는 AI 개발의 새로운 패러다임입니다. 정적 검색 후 읽기 패턴이나 신중히 스크립트된 프롬프트 시퀀스와 달리, Agentic RAG는 도구나 함수 호출 및 구조화된 출력을 포함한 반복적인 LLM 호출 루프를 특징으로 합니다. 매 단계마다 시스템은 얻은 결과를 평가하고, 쿼리를 개선하거나, 필요시 추가 도구를 호출하며, 만족스러운 솔루션이 나올 때까지 이 과정을 반복합니다.
이 반복적인 "maker-checker" 운영 스타일은 정확성을 개선하고, 구조화된 데이터베이스(NL2SQL 등)에 대한 잘못된 쿼리를 처리하며, 균형 잡힌 고품질 결과를 보장하도록 설계되었습니다. 신중히 설계된 프롬프트 체인에만 의존하는 대신, 시스템은 추론 과정을 적극적으로 소유합니다. 실패한 쿼리를 다시 작성하거나, 다른 검색 방법을 선택하고, 여러 도구(예: Azure AI Search의 벡터 검색, SQL 데이터베이스, 사용자 지정 API)를 통합하여 최종 답변을 도출합니다. 이는 지나치게 복잡한 오케스트레이션 프레임워크의 필요성을 제거합니다. 대신, "LLM 호출 → 도구 사용 → LLM 호출 → ..."라는 비교적 간단한 루프를 통해 정교하고 근거 있는 출력을 도출할 수 있습니다.
시스템을 "에이전틱"하게 만드는 가장 큰 특징은 추론 과정을 스스로 소유하는 능력입니다. 기존 RAG 구현은 모델이 어떤 정보를 검색하고 언제 검색해야 할지에 대한 체인을 인간이 사전에 정의하는 경우가 많습니다. 그러나 진정으로 에이전틱한 시스템은 문제를 해결하는 방법을 내부적으로 결정합니다. 단순히 스크립트를 실행하는 것이 아니라, 발견된 정보의 품질에 따라 단계의 순서를 자율적으로 결정합니다.
예를 들어, 제품 출시 전략을 수립하라는 요청을 받았을 때, 에이전틱 모델은 전체 연구 및 의사 결정 워크플로우를 명시하는 프롬프트에만 의존하지 않습니다. 대신, 모델은 독립적으로 다음 단계를 결정합니다:
- Bing Web Grounding을 사용하여 현재 시장 동향 보고서를 검색합니다.
- Azure AI Search를 사용하여 관련 경쟁사 데이터를 식별합니다.
- Azure SQL Database를 사용하여 과거 내부 판매 지표를 상관 분석합니다.
- Azure OpenAI Service를 통해 결과를 종합하여 일관된 전략을 작성합니다.
- 전략의 격차나 불일치를 평가하며, 필요한 경우 추가 검색을 진행합니다.
이 모든 단계—쿼리 개선, 소스 선택, "만족"할 때까지 반복—는 사람이 미리 스크립트화한 것이 아니라 모델이 스스로 결정합니다.
에이전틱 시스템은 반복적 상호작용 패턴에 의존합니다:
- 초기 호출: 사용자의 목표(사용자 프롬프트)가 LLM에 제시됩니다.
- 도구 호출: 모델이 누락된 정보나 모호한 지침을 식별하면, 벡터 데이터베이스 쿼리(예: Azure AI Search Hybrid search over private data)나 구조화된 SQL 호출과 같은 도구나 검색 방법을 선택하여 더 많은 컨텍스트를 수집합니다.
- 평가 및 개선: 반환된 데이터를 검토한 후, 모델은 정보가 충분한지 여부를 결정합니다. 그렇지 않다면, 쿼리를 개선하거나, 다른 도구를 시도하거나, 접근 방식을 조정합니다.
- 만족할 때까지 반복: 이 주기는 모델이 충분한 명확성과 증거를 확보하여 최종적이고 논리적인 응답을 제공할 때까지 계속됩니다.
- 메모리 및 상태: 시스템은 단계별로 상태와 메모리를 유지하기 때문에 이전 시도와 결과를 기억하고, 반복 루프를 피하며 더 나은 결정을 내릴 수 있습니다.
시간이 지남에 따라 이는 점진적인 이해를 형성하며, 모델이 복잡하고 다단계 작업을 인간의 지속적인 개입이나 프롬프트 재구성 없이도 처리할 수 있도록 합니다.
Agentic RAG의 자율성은 강력한 자기 수정 메커니즘도 포함합니다. 시스템이 막다른 길에 도달했을 때—예를 들어, 관련 없는 문서를 검색하거나 잘못된 쿼리를 마주칠 경우—다음과 같은 조치를 취할 수 있습니다:
- 반복 및 재쿼리: 가치가 낮은 응답을 반환하는 대신, 모델은 새로운 검색 전략을 시도하거나, 데이터베이스 쿼리를 다시 작성하거나, 대체 데이터 세트를 탐색합니다.
- 진단 도구 사용: 시스템은 추론 단계를 디버그하거나 검색된 데이터의 정확성을 확인하기 위해 추가 기능을 호출할 수 있습니다. Azure AI Tracing과 같은 도구는 강력한 관찰 가능성과 모니터링을 가능하게 합니다.
- 인간 감독 의존: 높은 위험이 있거나 반복적으로 실패하는 시나리오에서는 모델이 불확실성을 표시하고 인간의 지침을 요청할 수 있습니다. 인간이 교정 피드백을 제공하면, 모델은 이를 향후에 반영할 수 있습니다.
이 반복적이고 동적인 접근 방식은 모델이 지속적으로 개선되도록 하며, 단순히 한 번 실행되는 시스템이 아니라 세션 중에 실수를 학습하는 시스템이 되도록 보장합니다.
Agentic RAG는 작업 내에서 자율성을 가지지만, 이를 인공지능 일반 지능(AGI)과 동일시할 수는 없습니다. "에이전틱" 기능은 인간 개발자가 제공한 도구, 데이터 소스, 정책 내에서만 작동합니다. 자체 도구를 발명하거나 설정된 도메인 경계를 벗어날 수 없습니다. 대신, 제공된 자원을 동적으로 조정하는 데 탁월합니다.
주요 차이점은 다음과 같습니다:
- 도메인별 자율성: Agentic RAG 시스템은 알려진 도메인 내에서 사용자 정의 목표를 달성하는 데 중점을 두며, 쿼리 재작성이나 도구 선택과 같은 전략을 사용하여 결과를 개선합니다.
- 인프라 의존성: 시스템의 기능은 개발자가 통합한 도구와 데이터에 따라 달라집니다. 인간의 개입 없이는 이러한 경계를 초월할 수 없습니다.
- 안전 장치 준수: 윤리적 지침, 규정 준수 규칙, 비즈니스 정책은 여전히 매우 중요합니다. 에이전트의 자유는 항상 안전 조치와 감독 메커니즘에 의해 제한됩니다(희망적으로?).
Agentic RAG는 반복적인 정제와 정확성이 요구되는 시나리오에서 빛을 발합니다:
- 정확성 우선 환경: 규정 준수 검사, 규제 분석, 법률 연구와 같은 경우, 에이전틱 모델은 사실을 반복적으로 확인하고, 여러 소스를 참조하며, 쿼리를 다시 작성하여 철저히 검증된 답변을 제공합니다.
- 복잡한 데이터베이스 상호작용: 구조화된 데이터와 작업할 때 쿼리가 자주 실패하거나 조정이 필요한 경우, 시스템은 Azure SQL이나 Microsoft Fabric OneLake를 사용하여 쿼리를 자율적으로 정제하여 최종 검색 결과가 사용자의 의도와 일치하도록 보장합니다.
- 확장된 워크플로우: 새로운 정보가 표면화됨에 따라 세션이 진화할 수 있습니다. Agentic RAG는 문제 공간에 대해 더 많이 배우면서 지속적으로 새 데이터를 통합하고 전략을 변경할 수 있습니다.
이러한 시스템이 추론에서 더 자율적으로 발전함에 따라, 거버넌스와 투명성이 중요합니다:
- 설명 가능한 추론: 모델은 수행한 쿼리, 참조한 소스, 결론에 도달하기 위해 취한 추론 단계를 감사 추적 형태로 제공할 수 있습니다. Azure AI Content Safety와 Azure AI Tracing / GenAIOps와 같은 도구는 투명성을 유지하고 위험을 완화하는 데 도움이 됩니다.
- 편향 제어 및 균형 잡힌 검색: 개발자는 검색 전략을 조정하여 균형 잡힌 대표 데이터를 고려하도록 하고, Azure Machine Learning을 사용하는 고급 데이터 과학 조직의 사용자 지정 모델을 통해 출력물을 정기적으로 감사하여 편향이나 왜곡된 패턴을 감지할 수 있습니다.
- 인간 감독 및 규정 준수: 민감한 작업의 경우, 인간 검토는 여전히 필수적입니다. Agentic RAG는 고위험 결정에서 인간의 판단을 대체하는 것이 아니라, 더 철저히 검토된 옵션을 제공하여 이를 보완합니다.
다단계 프로세스를 디버깅하기 위해 명확한 작업 기록을 제공하는 도구가 필수적입니다. 그렇지 않으면 디버깅이 매우 어려울 수 있습니다. 아래는 Literal AI(Chainlit 개발 회사)의 에이전트 실행 예제입니다:
Agentic RAG는 AI 시스템이 복잡하고 데이터 집약적인 작업을 처리하는 방식에서 자연스러운 진화를 나타냅니다. 반복적인 상호작용 패턴을 채택하고, 도구를 자율적으로 선택하며, 고품질 결과를 달성할 때까지 쿼리를 정제함으로써, 이 시스템은 정적 프롬프트 추종을 넘어 보다 적응적이고 맥락을 인식하는 의사 결정자로 발전합니다. 여전히 인간이 정의한 인프라와 윤리적 지침에 의해 제한되지만, 이러한 에이전틱 기능은 기업과 최종 사용자 모두에게 더 풍부하고 동적이며 궁극적으로 더 유용한 AI 상호작용을 가능하게 합니다.
- Implement Retrieval Augmented Generation (RAG) with Azure OpenAI Service: Learn how to use your own data with the Azure OpenAI Service.This Microsoft Learn module provides a comprehensive guide on implementing RAG
- Evaluation of generative AI applications with Azure AI Foundry: This article covers the evaluation and comparison of models on publicly available datasets, including Agentic AI applications and RAG architectures
- What is Agentic RAG | Weaviate
- Agentic RAG: A Complete Guide to Agent-Based Retrieval Augmented Generation – News from generation RAG
- Agentic RAG: turbocharge your RAG with query reformulation and self-query! Hugging Face Open-Source AI Cookbook
- Adding Agentic Layers to RAG
- The Future of Knowledge Assistants: Jerry Liu
- How to Build Agentic RAG Systems
- Using Azure AI Foundry Agent Service to scale your AI agents
- 2303.17651 Self-Refine: Iterative Refinement with Self-Feedback
- 2303.11366 Reflexion: Language Agents with Verbal Reinforcement Learning
- 2305.11738 CRITIC: Large Language Models Can Self-Correct with Tool-Interactive Critiquing
**면책 조항**:
이 문서는 AI 기반 기계 번역 서비스를 사용하여 번역되었습니다. 정확성을 위해 노력하고 있지만, 자동 번역에는 오류나 부정확성이 포함될 수 있습니다. 원본 문서(모국어로 작성된 문서)가 권위 있는 자료로 간주되어야 합니다. 중요한 정보의 경우, 전문적인 인간 번역을 권장합니다. 이 번역을 사용함으로 인해 발생하는 오해나 잘못된 해석에 대해 당사는 책임을 지지 않습니다.