문서 관리
개요
Starnion의 문서 관리 기능은 PDF, Word, Excel, PowerPoint, 텍스트 파일 등 다양한 형식의 문서를 업로드하고 AI와 함께 활용할 수 있는 기능입니다. 문서를 올리면 AI가 내용을 자동으로 읽고 분석하여, 채팅에서 “계약서에서 납기일 찾아줘”처럼 자연어로 질문할 수 있습니다.
업로드된 문서는 텍스트 추출 → 청킹 → 벡터 임베딩 과정을 거쳐 검색 가능한 상태로 저장됩니다. 이후 AI가 관련 내용을 찾아 정확한 답변을 제공합니다.
지원 형식
| 형식 | 확장자 | 텍스트 추출 | AI 검색 | AI 채팅 활용 |
|---|---|---|---|---|
| 가능 | 가능 | 가능 | ||
| Word | .doc, .docx | 가능 | 가능 | 가능 |
| Excel | .xls, .xlsx | 가능 | 가능 | 가능 |
| PowerPoint | .ppt, .pptx | 가능 | 가능 | 가능 |
| 일반 텍스트 | .txt | 가능 | 가능 | 가능 |
| 마크다운 | .md | 가능 | 가능 | 가능 |
| CSV | .csv | 가능 | 가능 | 가능 |
HWP(한글) 파일은 현재 직접 지원하지 않습니다. HWP 파일은 PDF로 내보낸 후 업로드하세요.
문서 업로드
채팅에서 파일 첨부
채팅 입력창 하단의 파일 첨부 버튼을 눌러 문서를 선택하거나, 파일을 채팅창에 드래그앤드롭하면 됩니다.
사용자: [계약서.pdf 첨부]
AI: 계약서.pdf를 업로드했어요. 내용을 분석 중입니다... 완료!
이제 이 문서에 대해 질문할 수 있어요.
사용자: 이 계약서의 납기일이 언제야?
AI: 계약서 4조에 따르면 납기일은 2025년 6월 30일입니다.
구체적으로는 "을(乙)은 2025년 6월 30일까지 제품을 납품하여야 한다"고 명시되어 있습니다.
문서 관리 메뉴에서 업로드
상단 메뉴 > 문서 탭에서 문서 업로드 버튼을 클릭하거나, 파일을 드래그앤드롭 영역에 놓으면 됩니다.
문서 처리 과정
문서를 업로드하면 백그라운드에서 다음 과정이 자동으로 진행됩니다.
1. 업로드 → MinIO 스토리지에 파일 저장
2. 파싱 → 파일 형식에 맞게 텍스트 추출
3. 청킹 → 긴 문서를 적절한 크기로 분할
4. 벡터 임베딩 → 각 청크를 AI가 이해할 수 있는 벡터로 변환
5. 저장 → 검색 가능한 상태로 데이터베이스에 저장
6. 완료 → AI 채팅에서 즉시 활용 가능
처리 시간은 파일 크기에 따라 다릅니다. 1MB 미만의 문서는 보통 10초 이내에 완료됩니다.
문서 검색 및 질의응답
업로드된 문서 내용을 AI에게 자연어로 질문할 수 있습니다.
계약서 관련:
사용자: 계약서에서 위약금 조항 찾아줘
AI: 제8조(위약금)에 따르면: 을(乙)이 납기를 지킬 수 없을 경우
지연 1일당 계약금액의 0.1%를 위약금으로 지불하여야 합니다.
회의록 요약:
사용자: 지난 회의록에서 결정된 사항만 요약해줘
AI: 3월 5일 회의에서 결정된 사항:
1. 신규 기능 출시일: 4월 15일
2. 마케팅 예산: 500만원 승인
3. 담당자: 김팀장 (개발), 이부장 (마케팅)
엑셀 데이터 분석:
사용자: 1월 매출 데이터에서 가장 많이 팔린 제품 5개 알려줘
AI: 1월 매출 상위 5개 제품:
1위: 제품A - 1,250개 (3,750,000원)
2위: 제품B - 980개 (2,940,000원)
...
AI 채팅으로 문서 활용
문서 첨부 후 질문
채팅에서 문서를 직접 첨부하면 그 문서를 기반으로 대화할 수 있습니다.
사용자: [직원 매뉴얼.pdf 첨부] 연차 사용 규정 요약해줘
AI: 매뉴얼 제3장(휴가 규정) 요약:
- 연차 발생: 입사 1년 후 15일, 이후 2년마다 1일 추가 (최대 25일)
- 사용 기한: 발생일로부터 1년 이내
- 신청 방법: 사용 3일 전 팀장 승인 필요
- 반차: 오전(09:00~13:00), 오후(14:00~18:00) 분할 가능
여러 문서 비교
사용자: 두 개의 견적서를 비교해서 어떤 게 더 유리한지 알려줘
AI: A업체와 B업체 견적서 비교:
A업체: 총 450만원, 납기 30일, 보증기간 1년
B업체: 총 480만원, 납기 25일, 보증기간 2년
→ B업체가 30만원 더 비싸지만 납기가 5일 빠르고 보증기간이 2배입니다.
AI 문서 생성
AI에게 새 문서나 보고서 작성을 요청할 수도 있습니다. 생성된 문서는 자동으로 문서 목록에 저장됩니다.
사용자: 3월 업무 보고서 초안 작성해줘. 이번 달 완료한 작업은 신규 기능 개발 3건, 버그 수정 12건이야
AI: 3월 업무 보고서를 작성했어요.
[보고서.docx 생성됨]
문서 탭에서 다운로드할 수 있습니다.
문서 관리
문서 목록 조회
문서 탭에서 업로드한 모든 문서를 날짜 순으로 확인할 수 있습니다. 최대 100개까지 표시됩니다.
문서 삭제
문서 목록에서 삭제할 문서 옆의 삭제 버튼을 클릭하거나, 채팅에서 요청할 수 있습니다.
사용자: "2024 결산보고서.pdf" 삭제해줘
AI: 2024 결산보고서.pdf를 삭제했어요.
제한사항
| 항목 | 제한 |
|---|---|
| 최대 파일 크기 | 50MB |
| 목록 표시 | 최근 100개 |
| 지원 형식 | PDF, DOC, DOCX, XLS, XLSX, PPT, PPTX, TXT, MD, CSV |
| 비지원 형식 | HWP, 이미지 파일 (이미지는 이미지 탭 사용) |
팁 & FAQ
Q. 문서를 올렸는데 AI가 내용을 모른다고 해요. A. 파일 처리에 시간이 걸릴 수 있습니다. 잠시 후 다시 질문해 보세요. 대용량 파일은 처리에 1~2분 소요될 수 있습니다.
Q. 스캔된 PDF도 읽을 수 있나요? A. 스캔 PDF는 이미지로 구성되어 텍스트 추출이 어렵습니다. OCR 처리된 PDF나 텍스트가 포함된 PDF를 사용해 주세요.
Q. 엑셀 파일에서 특정 시트의 내용만 질문할 수 있나요? A. 질문 시 시트명을 함께 언급하면 됩니다. 예: “매출 시트에서 3월 합계 알려줘”
Q. 업로드한 문서는 안전하게 보관되나요? A. 모든 문서는 암호화된 MinIO 스토리지에 저장되며, 본인만 접근할 수 있습니다.
문서 파싱 엔진
Starnion v1.2.0부터 Docling (IBM 오픈소스, MIT 라이선스)을 문서 파싱 엔진으로 사용합니다. 기존 단순 텍스트 추출 방식 대비 다음이 개선되었습니다:
| 개선 사항 | 이전 | 이후 |
|---|---|---|
| PDF 표 | 텍스트만 추출 | 표 구조 보존 |
| 헤딩 구조 | 무시됨 | 섹션 단위 청킹 |
| PPTX 레이아웃 | 텍스트 나열 | 슬라이드 구조 인식 |
| 검색 품질 | 단순 문자 분할 | 의미 단위 청킹 |
이미지 파일(PNG, JPG, GIF, BMP, TIFF)도 OCR을 통해 텍스트 추출이 가능합니다.