오디오
개요
Starnion의 오디오 기능은 음성 파일을 업로드하면 AI가 자동으로 텍스트로 변환(STT)하고, 그 결과를 회의록, 메모, 일기 등으로 저장할 수 있는 기능입니다.
회의 녹음 파일을 올리면 몇 초 만에 전체 내용이 텍스트로 변환되고, “요약해줘”, “결정 사항만 추려줘” 같은 명령으로 바로 정리할 수 있습니다. 업로드된 오디오 파일과 전사 텍스트는 오디오 갤러리에서 모아볼 수 있습니다.
지원 형식
| 형식 | 확장자 | STT 지원 | 재생 |
|---|---|---|---|
| MP3 | .mp3 | 가능 | 가능 |
| WAV | .wav | 가능 | 가능 |
| M4A | .m4a | 가능 | 가능 |
| OGG | .ogg | 가능 | 가능 |
오디오 업로드
채팅에서 오디오 첨부
채팅 입력창의 파일 첨부 버튼을 클릭하거나, 오디오 파일을 채팅창에 드래그앤드롭하여 업로드할 수 있습니다.
사용자: [회의녹음.mp3 첨부] 전사해줘
AI: 음성을 텍스트로 변환 중입니다...
[전사 결과]
김팀장: 오늘 안건은 신규 서비스 출시 일정입니다.
이주임: 개발은 4월 말까지 완료 예정입니다.
박차장: 마케팅 준비는 5월 초 시작 가능합니다.
김팀장: 그러면 5월 15일 출시로 잡겠습니다.
총 3분 24초 분량입니다.
오디오 갤러리에서 업로드
상단 메뉴 > 오디오 탭에서 업로드 버튼을 클릭하거나 드래그앤드롭으로 추가할 수 있습니다.
음성 텍스트 변환 (STT)
업로드된 오디오는 자동으로 STT 처리됩니다. 전사 결과는 오디오 갤러리에 저장되며 나중에도 조회할 수 있습니다.
전사 후 활용 예시:
사용자: [강의녹음.mp3 첨부] 핵심 내용만 요약해줘
AI: 강의 내용 요약 (총 45분 분량):
주제: Python 데이터 분석 기초
핵심 내용:
1. Pandas DataFrame 생성 및 조작
2. 결측값 처리 방법 (dropna, fillna)
3. 그룹별 집계 (groupby)
4. 시각화 기초 (matplotlib)
실습 과제: 타이타닉 데이터셋으로 생존율 분석
회의록 자동 작성:
사용자: [회의.wav 첨부] 회의록 양식으로 정리해줘
AI: [2025년 3월 8일 마케팅팀 회의록]
참석자: 김팀장, 이주임, 박차장
일시: 2025-03-08 14:00
1. 안건: Q2 마케팅 전략
2. 논의 내용:
- SNS 광고 예산 50% 증액 논의
- 인플루언서 협업 2건 추진
3. 결정 사항:
- 4월 인스타그램 광고 시작
- 5월 유튜버 협업 진행
4. 다음 회의: 3월 22일 오후 2시
전사 결과 활용
STT로 변환된 텍스트는 다양하게 활용할 수 있습니다.
메모로 저장:
사용자: [아이디어 음성메모.m4a 첨부] 이거 메모에 저장해줘
AI: 음성 내용을 메모로 저장했어요:
제목: 앱 아이디어 메모 (2025-03-08)
내용: 운동 기록 앱에 AI 트레이너 기능 추가,
음성으로 세트 수 기록하는 기능...
일기로 저장:
사용자: [오늘하루.mp3 첨부] 오늘 일기로 저장해줘
AI: 음성 내용을 일기로 저장했어요:
[2025년 3월 8일]
오늘은 팀 미팅이 있었다. 새 프로젝트 시작하는 날이어서
약간 긴장됐지만, 팀원들이 잘 도와줘서...
가계부 연동:
사용자: [쇼핑 기록.mp3 첨부] 오늘 쇼핑한 거 가계부에 기록해줘
(음성: "마트에서 장 봤어. 채소 15천원, 고기 32천원, 음료 8천원")
AI: 음성에서 지출 항목을 인식했어요:
- 채소: 15,000원
- 고기: 32,000원
- 음료: 8,000원
합계 55,000원을 식비로 기록했습니다.
오디오 갤러리
오디오 탭에서 지금까지 업로드한 모든 오디오 파일을 확인할 수 있습니다.
갤러리 필터
| 필터 | 설명 |
|---|---|
| 전체 | 모든 오디오 파일 |
| 업로드됨 | 직접 업로드한 파일 |
| 생성됨 | TTS로 생성된 오디오 |
| 웹 채팅 | 웹에서 첨부한 파일 |
| 텔레그램 | 텔레그램에서 전송한 파일 |
갤러리에서 할 수 있는 것
- 오디오 재생 (브라우저 내에서)
- 전사 텍스트 확인 및 수정
- 파일 정보 확인 (파일명, 크기, 업로드 시간)
- 파일 삭제
전사 텍스트 수정
STT 결과가 부정확한 경우 직접 수정할 수 있습니다. 오디오 갤러리에서 해당 파일을 클릭하면 전사 텍스트를 편집할 수 있습니다.
TTS — AI 응답을 음성으로 듣기
AI 응답을 텍스트 대신 음성으로 받고 싶을 때 사용합니다.
사용자: 오늘 일정 음성으로 읽어줘
AI: [🔊 오디오 재생]
"안녕하세요! 오늘 3월 8일 일정입니다.
오전 10시에 팀 미팅이 있고,
오후 2시에 클라이언트 미팅이 예정되어 있습니다.
저녁 7시에는 운동 알림이 설정되어 있습니다."
활용 예시
회의 녹음 → 자동 요약:
사용자: [90분_기획회의.mp3 첨부] 10줄로 요약해줘
AI: 기획 회의 요약 (원본 90분):
1. Q3 신규 기능: 소셜 로그인 추가 확정
2. UI 개선: 다크모드 지원 우선 순위 1위
3. 예산: 개발 인력 2명 추가 채용 승인
4. 일정: 베타 출시 6월 30일 목표
5. 마케팅: 앱스토어 최적화 전담팀 구성
... (총 10개 요약)
강의 녹음 → 학습 노트:
사용자: [영어강의.m4a 첨부] 모르는 단어와 표현 정리해줘
AI: 강의에서 등장한 주요 표현:
- "leverage" (활용하다): "We need to leverage our existing data"
- "bottleneck" (병목): "This is a bottleneck in our process"
- "iterate" (반복하다): "Let's iterate on this design"
총 15개 표현 정리됨. 플래시카드로 만들어 드릴까요?
인터뷰 녹음 → 텍스트 정리:
사용자: [인터뷰.wav 첨부] Q&A 형식으로 정리해줘
AI: 인터뷰 Q&A 정리:
Q: 현재 업무에서 가장 중요하게 생각하는 것은?
A: 팀원 간의 소통과 신뢰라고 생각합니다...
Q: 앞으로의 커리어 목표는 무엇인가요?
A: 5년 안에 기술 리더로 성장하는 것이 목표입니다...
💬 텔레그램 사용 예시
니온에게 자연어로 말하면 됩니다. 정해진 명령어 없이 일상 언어로 대화하세요!
음성 메시지 전사
[음성 메시지 전송] 이거 텍스트로 바꿔줘
→ 음성을 텍스트로 변환합니다
[회의 녹음 파일 첨부] 요약해줘
→ 녹음 파일을 텍스트로 변환 후 핵심 내용을 요약합니다
음성 파일 활용
[영어 강의 녹음 첨부] 모르는 단어 정리해줘
→ 강의 내용에서 주요 표현과 단어를 정리합니다
[인터뷰 녹음 첨부] Q&A 형식으로 정리해줘
→ 인터뷰 내용을 질문-답변 형태로 정리합니다
팁 & FAQ
Q. 긴 파일(1시간 이상)도 전사할 수 있나요? A. 긴 파일은 처리 시간이 오래 걸릴 수 있습니다. 30분 이상의 파일은 여러 개로 나눠서 업로드하면 더 빠르게 처리됩니다.
Q. 여러 사람이 동시에 말하면 인식이 잘 안 돼요. A. 여러 사람이 동시에 말하거나 배경 소음이 많으면 정확도가 떨어질 수 있습니다. 조용한 환경에서 녹음한 파일의 인식률이 높습니다.
Q. 한국어 외 다른 언어도 인식되나요? A. 영어, 일본어, 중국어 등 주요 언어를 지원합니다. 다국어가 섞인 경우에도 어느 정도 인식됩니다.
Q. 전사된 텍스트를 다운로드할 수 있나요? A. 오디오 갤러리에서 전사 텍스트를 확인하고 복사할 수 있습니다. 채팅에서 “전사 내용 보여줘”라고 요청하면 전체 내용을 텍스트로 출력합니다.
Q. 전화 통화 녹음도 업로드할 수 있나요? A. 기술적으로는 가능하지만, 상대방 동의 없이 녹음한 통화를 처리하는 것은 법적으로 문제가 될 수 있습니다. 관련 법률을 확인해 주세요.