오디오

개요

Starnion의 오디오 기능은 음성 파일을 업로드하면 AI가 자동으로 텍스트로 변환(STT)하고, 그 결과를 회의록, 메모, 일기 등으로 저장할 수 있는 기능입니다.

회의 녹음 파일을 올리면 몇 초 만에 전체 내용이 텍스트로 변환되고, “요약해줘”, “결정 사항만 추려줘” 같은 명령으로 바로 정리할 수 있습니다. 업로드된 오디오 파일과 전사 텍스트는 오디오 갤러리에서 모아볼 수 있습니다.

지원 형식

형식	확장자	STT 지원	재생
MP3	.mp3	가능	가능
WAV	.wav	가능	가능
M4A	.m4a	가능	가능
OGG	.ogg	가능	가능

오디오 업로드

채팅에서 오디오 첨부

채팅 입력창의 파일 첨부 버튼을 클릭하거나, 오디오 파일을 채팅창에 드래그앤드롭하여 업로드할 수 있습니다.

사용자: [회의녹음.mp3 첨부] 전사해줘
AI:    음성을 텍스트로 변환 중입니다...

       [전사 결과]
       김팀장: 오늘 안건은 신규 서비스 출시 일정입니다.
       이주임: 개발은 4월 말까지 완료 예정입니다.
       박차장: 마케팅 준비는 5월 초 시작 가능합니다.
       김팀장: 그러면 5월 15일 출시로 잡겠습니다.

       총 3분 24초 분량입니다.

오디오 갤러리에서 업로드

상단 메뉴 > 오디오 탭에서 업로드 버튼을 클릭하거나 드래그앤드롭으로 추가할 수 있습니다.

음성 텍스트 변환 (STT)

업로드된 오디오는 자동으로 STT 처리됩니다. 전사 결과는 오디오 갤러리에 저장되며 나중에도 조회할 수 있습니다.

전사 후 활용 예시:

사용자: [강의녹음.mp3 첨부] 핵심 내용만 요약해줘
AI:    강의 내용 요약 (총 45분 분량):

       주제: Python 데이터 분석 기초

       핵심 내용:
       1. Pandas DataFrame 생성 및 조작
       2. 결측값 처리 방법 (dropna, fillna)
       3. 그룹별 집계 (groupby)
       4. 시각화 기초 (matplotlib)

       실습 과제: 타이타닉 데이터셋으로 생존율 분석

회의록 자동 작성:

사용자: [회의.wav 첨부] 회의록 양식으로 정리해줘
AI:    [2025년 3월 8일 마케팅팀 회의록]

       참석자: 김팀장, 이주임, 박차장
       일시: 2025-03-08 14:00

       1. 안건: Q2 마케팅 전략
       2. 논의 내용:
          - SNS 광고 예산 50% 증액 논의
          - 인플루언서 협업 2건 추진
       3. 결정 사항:
          - 4월 인스타그램 광고 시작
          - 5월 유튜버 협업 진행
       4. 다음 회의: 3월 22일 오후 2시

전사 결과 활용

STT로 변환된 텍스트는 다양하게 활용할 수 있습니다.

메모로 저장:

사용자: [아이디어 음성메모.m4a 첨부] 이거 메모에 저장해줘
AI:    음성 내용을 메모로 저장했어요:
       제목: 앱 아이디어 메모 (2025-03-08)
       내용: 운동 기록 앱에 AI 트레이너 기능 추가,
              음성으로 세트 수 기록하는 기능...

일기로 저장:

사용자: [오늘하루.mp3 첨부] 오늘 일기로 저장해줘
AI:    음성 내용을 일기로 저장했어요:
       [2025년 3월 8일]
       오늘은 팀 미팅이 있었다. 새 프로젝트 시작하는 날이어서
       약간 긴장됐지만, 팀원들이 잘 도와줘서...

가계부 연동:

사용자: [쇼핑 기록.mp3 첨부] 오늘 쇼핑한 거 가계부에 기록해줘
       (음성: "마트에서 장 봤어. 채소 15천원, 고기 32천원, 음료 8천원")
AI:    음성에서 지출 항목을 인식했어요:
       - 채소: 15,000원
       - 고기: 32,000원
       - 음료: 8,000원
       합계 55,000원을 식비로 기록했습니다.

오디오 갤러리

오디오 탭에서 지금까지 업로드한 모든 오디오 파일을 확인할 수 있습니다.

갤러리 필터

필터	설명
전체	모든 오디오 파일
업로드됨	직접 업로드한 파일
생성됨	TTS로 생성된 오디오
웹 채팅	웹에서 첨부한 파일
텔레그램	텔레그램에서 전송한 파일

갤러리에서 할 수 있는 것

오디오 재생 (브라우저 내에서)
전사 텍스트 확인 및 수정
파일 정보 확인 (파일명, 크기, 업로드 시간)
파일 삭제

전사 텍스트 수정

STT 결과가 부정확한 경우 직접 수정할 수 있습니다. 오디오 갤러리에서 해당 파일을 클릭하면 전사 텍스트를 편집할 수 있습니다.

TTS — AI 응답을 음성으로 듣기

AI 응답을 텍스트 대신 음성으로 받고 싶을 때 사용합니다.

사용자: 오늘 일정 음성으로 읽어줘
AI:    [🔊 오디오 재생]
       "안녕하세요! 오늘 3월 8일 일정입니다.
       오전 10시에 팀 미팅이 있고,
       오후 2시에 클라이언트 미팅이 예정되어 있습니다.
       저녁 7시에는 운동 알림이 설정되어 있습니다."

활용 예시

회의 녹음 → 자동 요약:

사용자: [90분_기획회의.mp3 첨부] 10줄로 요약해줘
AI:    기획 회의 요약 (원본 90분):

       1. Q3 신규 기능: 소셜 로그인 추가 확정
       2. UI 개선: 다크모드 지원 우선 순위 1위
       3. 예산: 개발 인력 2명 추가 채용 승인
       4. 일정: 베타 출시 6월 30일 목표
       5. 마케팅: 앱스토어 최적화 전담팀 구성
       ... (총 10개 요약)

강의 녹음 → 학습 노트:

사용자: [영어강의.m4a 첨부] 모르는 단어와 표현 정리해줘
AI:    강의에서 등장한 주요 표현:
       - "leverage" (활용하다): "We need to leverage our existing data"
       - "bottleneck" (병목): "This is a bottleneck in our process"
       - "iterate" (반복하다): "Let's iterate on this design"
       총 15개 표현 정리됨. 플래시카드로 만들어 드릴까요?

인터뷰 녹음 → 텍스트 정리:

사용자: [인터뷰.wav 첨부] Q&A 형식으로 정리해줘
AI:    인터뷰 Q&A 정리:

       Q: 현재 업무에서 가장 중요하게 생각하는 것은?
       A: 팀원 간의 소통과 신뢰라고 생각합니다...

       Q: 앞으로의 커리어 목표는 무엇인가요?
       A: 5년 안에 기술 리더로 성장하는 것이 목표입니다...

💬 텔레그램 사용 예시

니온에게 자연어로 말하면 됩니다. 정해진 명령어 없이 일상 언어로 대화하세요!

음성 메시지 전사

[음성 메시지 전송] 이거 텍스트로 바꿔줘

→ 음성을 텍스트로 변환합니다

[회의 녹음 파일 첨부] 요약해줘

→ 녹음 파일을 텍스트로 변환 후 핵심 내용을 요약합니다

음성 파일 활용

[영어 강의 녹음 첨부] 모르는 단어 정리해줘

→ 강의 내용에서 주요 표현과 단어를 정리합니다

[인터뷰 녹음 첨부] Q&A 형식으로 정리해줘

→ 인터뷰 내용을 질문-답변 형태로 정리합니다

팁 & FAQ

Q. 긴 파일(1시간 이상)도 전사할 수 있나요? A. 긴 파일은 처리 시간이 오래 걸릴 수 있습니다. 30분 이상의 파일은 여러 개로 나눠서 업로드하면 더 빠르게 처리됩니다.

Q. 여러 사람이 동시에 말하면 인식이 잘 안 돼요. A. 여러 사람이 동시에 말하거나 배경 소음이 많으면 정확도가 떨어질 수 있습니다. 조용한 환경에서 녹음한 파일의 인식률이 높습니다.

Q. 한국어 외 다른 언어도 인식되나요? A. 영어, 일본어, 중국어 등 주요 언어를 지원합니다. 다국어가 섞인 경우에도 어느 정도 인식됩니다.

Q. 전사된 텍스트를 다운로드할 수 있나요? A. 오디오 갤러리에서 전사 텍스트를 확인하고 복사할 수 있습니다. 채팅에서 “전사 내용 보여줘”라고 요청하면 전체 내용을 텍스트로 출력합니다.

Q. 전화 통화 녹음도 업로드할 수 있나요? A. 기술적으로는 가능하지만, 상대방 동의 없이 녹음한 통화를 처리하는 것은 법적으로 문제가 될 수 있습니다. 관련 법률을 확인해 주세요.