도움말

자주 묻는 질문

검색 결과가 없으면 어떻게 하나요?

먼저 '데이터 수집' 페이지에서 해당 기업의 특허를 수집해주세요. 수집 후 벡터 DB에 데이터가 저장되면 검색이 가능합니다.

어떤 질문을 해야 좋은 결과를 얻나요?

구체적인 기술 키워드를 포함해주세요. 예: '2차전지 열 관리 기술', 'ERP 클라우드 마이그레이션' 등 기술 분야를 명시하면 더 정확한 결과를 얻을 수 있습니다.

데이터 수집 시 회사명은 어떻게 입력하나요?

KIPRIS에 등록된 공식 법인명을 사용하세요. 예: 삼성전자, 에스케이하이닉스, 엘지에너지솔루션, 더존비즈온

임베딩은 어떤 모델을 사용하나요?

HuggingFace의 all-MiniLM-L6-v2 모델을 로컬에서 실행합니다. 384차원 벡터로 변환하여 Pinecone에 저장합니다.

RAG 파이프라인

Retrieval-Augmented Generation — 질문에 관련된 문서를 검색한 뒤, LLM이 답변을 생성하는 방식입니다.

1단계

질문 입력

사용자가 자연어로 질문을 입력합니다.

2단계

벡터 변환

HuggingFace 모델로 질문을 384차원 벡터로 변환합니다.

3단계

유사도 검색

Pinecone에서 코사인 유사도 기반으로 관련 청크를 검색합니다.

4단계

청크 추출

유사도가 높은 상위 5개 특허 청크를 추출합니다.

5단계

AI 답변 생성

추출된 청크를 컨텍스트로 llama3가 답변을 생성합니다.

기술 스택

데이터 수집

KIPRIS API

한국 특허정보 공공 API

임베딩 & 벡터 DB

all-MiniLM-L6-v2

HuggingFace 384차원 임베딩 모델 (로컬 실행)

Pinecone

관리형 벡터 데이터베이스, 코사인 유사도 검색

LLM & 프레임워크

llama3 8B

Ollama 로컬 실행 LLM, 답변 생성 담당

LangChain

RAG 파이프라인 오케스트레이션 프레임워크

백엔드 & 프론트엔드

FastAPI

Python 비동기 웹 프레임워크, REST API 서빙

Next.js

React 기반 프론트엔드, TypeScript + Tailwind