Gemini RAG: Multimodal RAG API
Google Gemini API가 멀티모달 파일 검색 기능을 출시하여, 텍스트와 이미지를 통합적으로 처리하고 검색 결과를 특정 페이지까지 추적할 수 있게 되었습니다. 이 업데이트는 기존 RAG 시스템 구축 방식에 큰 변화를 가져오며, 기업 내 다양한 문서 처리 요구사항을 충족할 수 있는 잠재력을 지닙니다.
핵심 요약
- Gemini API의 파일 검색 기능이 멀티모달로 확장되어 텍스트뿐만 아니라 이미지도 함께 저장하고 검색할 수 있게 되었습니다.
- 새로운 기능은 이미지와 텍스트를 동일한 임베딩 공간에 저장하며, 단일 쿼리로 두 가지 종류의 데이터를 모두 검색할 수 있습니다.
- 사용자는 문서에 사용자 정의 메타데이터(예: 부서, 지역)를 첨부하여 검색 시 필터링할 수 있습니다.
전체 요약과 종목별 의견·실시간 분석을 보려면 로그인하세요.
로그인 / 회원가입