RAG는 LLM모델을 강화하는 방법 중 하나이다.
기존 언어 모델에 외부 지식을 결합하여 “최신 정보”를 제공한다.
작동 원리
- Retreival (검색)
질문을 부석해 외부 DB를 기반으로 검색하고 그 중 연관성 높은 정보를 선별한다.
- Augmented (증강)
LLM입력에 1의 결과를 요약 / 재구성 / 가중치 부여 등의 처리를 한 후 추가한다.
- Generation (최종 응답 생성)
1, 2의 결과를 기반으로 최종 응답을 생성한다.
해결한 문제
- 지식의 한계
LLM은 학습된 시점까지의 정보만 가질 수 있다는 한계 극복
- 환각 현상 (hallucination)
학습 데이터의 패턴을 따라 존재하지 않는 정보를 생성하는 환각 현상 완화
- 출처 제시가 어려운 문제
검색을 기반으로 함으로써 해당 문제 완화
- 특정 도메인에 대한 전문지식 갖기 어려운 문제
범용 LLM의 전문성 부족 문제 완화
단점
- 검색과정으로 인해 계산 복잡도 증가
- 데이터 소스에 대한 의존성
데이터 소스에 대한 검증과 관리 필수
- 보안 / 프라이버시 문제
외부 DB사용으로 민감 정보가 노출될 가능성 존재