메타AI뉴스

구글, ‘파일 서치’ 공개엔지니어링 부담 없앤 완전 관리형 RAG 시스템

메타ai뉴스 이현우 교수 칼럼

구글, ‘파일 서치’ 공개
엔지니어링 부담 없앤 완전 관리형 RAG 시스템

글로벌연합대학 버지니아대학교
인공지능융합연구소 이현우 교수

최근 기업용 생성형 AI의 핵심 기술로 ‘검색 증강 생성(RAG)’이 주목받고 있습니다. RAG는 AI 모델이 학습된 지식에만 의존하는 것이 아니라, 실시간으로 외부 문서를 검색하고 인용하여 더 정확하고 검증 가능한 답변을 생성하는 방식입니다. 하지만 기존에는 RAG 파이프라인을 구축하기 위해 파일 저장, 분할, 임베딩, 벡터 검색, 인덱싱 등 복잡한 과정을 엔지니어가 직접 연결해야 하는 큰 부담이 있었습니다.

구글은 이러한 복잡성을 해결하기 위해 제미나이(Gemini) API에 ‘파일 서치(File Search)’라는 새로운 완전 관리형 RAG 시스템을 공개했습니다. 이 기능의 핵심은 복잡한 검색 및 임베딩 파이프라인 구축 과정을 모두 추상화하여 자동화한 것입니다.

개발자는 ‘제너레이트콘텐트(generateContent)’ API에서 파일 서치를 호출하기만 하면, 제미나이가 알아서 파일 저장, 분할 전략, 임베딩 생성 및 검색까지 모든 과정을 수행합니다. 이는 기업이 별도의 인프라를 조합하는 수고 없이도 자체 데이터를 활용해 신뢰도 높은 AI 응답을 생성할 수 있게 되었음을 의미합니다.

파일 서치 기능은 MTEB(Massive Text Embedding Benchmark)에서 최고 성능을 기록한 ‘제미나이 임베딩’ 모델을 기반으로 합니다. 벡터 검색 기술을 활용하여 사용자가 정확한 키워드를 입력하지 않아도 질문의 의미와 맥락을 파악해 관련 정보를 찾아냅니다. 또한, AI가 답변을 생성할 때 어떤 문서의 어느 부분을 근거로 했는지 명시하는 ‘인용(citation)’ 기능을 자동으로 삽입하여 답변의 신뢰도를 높였습니다.
현재 PDF, DOCX, TXT, JSON 및 다양한 프로그래밍 언어 파일을 지원하며, 일부 스토리지와 임베딩 기능은 무료로 제공되고 인덱싱 시 100만 토큰당 0.15달러의 요금이 부과됩니다.

구글은 파일 서치가 단순히 RAG의 일부 구성 요소만 관리하는 경쟁 솔루션(OpenAI 어시스턴트 API, AWS 베드록 등)과 달리, RAG 파이프라인 전체를 자동화한다는 점에서 차별점을 갖는다고 강조했습니다. 이 기능은 현재 제미나이 API를 통해 이용 가능하며, 앞으로 기업 규모와 데이터 형식에 맞춘 확장 옵션도 선보일 예정입니다.

편집위원 이현우 교수
heir201933@gmail.com

댓글 달기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

위로 스크롤