音声
概要
Starnionの音声機能は、アップロードされた音声ファイルを自動的にテキストに文字起こし(Speech-to-Text / STT)し、その結果を議事録、メモ、日記などとして保存できます。
ミーティングの録音をアップロードすると、全内容が数秒でテキストに変換されます。その後「これをまとめて」「決定事項だけを抽出して」などのコマンドですぐに整理できます。アップロードされたすべての音声ファイルとその文字起こしは音声ギャラリーにまとめられます。
対応フォーマット
| フォーマット | 拡張子 | STT対応 | 再生 |
|---|---|---|---|
| MP3 | .mp3 | 対応 | 対応 |
| WAV | .wav | 対応 | 対応 |
| M4A | .m4a | 対応 | 対応 |
| OGG | .ogg | 対応 | 対応 |
音声をアップロードする
チャットで音声を添付する
チャット入力欄のファイル添付ボタンをクリックするか、音声ファイルをチャットウィンドウにドラッグ&ドロップしてアップロードします。
ユーザー:[meeting-recording.mp3 を添付] 文字起こしをお願いします。
AI: 音声をテキストに変換中...
[文字起こし]
田中チームリーダー:今日の議題は新サービスのローンチスケジュールです。
鈴木アシスタント:開発は4月末までに完了する予定です。
佐藤副部長:マーケティングの準備は5月上旬から始められます。
田中チームリーダー:では、ローンチ日を5月15日に設定しましょう。
合計時間:3分24秒。
音声ギャラリーからアップロードする
上部メニュー > 「音声」 タブに移動し、アップロードボタンをクリックするか、ドラッグ&ドロップでファイルを追加します。
音声テキスト変換(STT)
アップロードされた音声は自動的にSTT処理されます。文字起こし結果は音声ギャラリーに保存され、いつでも確認できます。
文字起こしの活用例:
ユーザー:[lecture-recording.mp3 を添付] 要点をまとめて。
AI: 講義まとめ(合計45分):
テーマ:Pythonデータ分析入門
要点:
1. PandasのDataFrame作成と操作
2. 欠損値の処理(dropna、fillna)
3. グループ集計(groupby)
4. 可視化の基本(matplotlib)
実践課題:Titanicデータセットを使った生存率の分析
自動議事録作成:
ユーザー:[meeting.wav を添付] これを議事録の形式にまとめて。
AI: [マーケティングチーム ミーティング議事録 — 2025年3月8日]
出席者:田中チームリーダー、鈴木アシスタント、佐藤副部長
日時:2025-03-08 14:00
1. 議題:Q2マーケティング戦略
2. 議論内容:
- SNS広告予算の50%増額を検討
- インフルエンサーとのコラボ案件2件を推進
3. 決定事項:
- 4月にInstagram広告を開始
- 5月にYouTuberコラボを実施
4. 次回ミーティング:3月22日 14:00
文字起こしを活用する
STTで変換されたテキストは様々な用途に活用できます。
メモとして保存する:
ユーザー:[idea-voice-memo.m4a を添付] メモとして保存して。
AI: 音声内容をメモとして保存しました:
タイトル:アプリアイデアメモ(2025-03-08)
内容:ワークアウト追跡アプリにAIトレーナー機能を追加する、
音声でセットを記録する機能...
日記エントリとして保存する:
ユーザー:[today.mp3 を添付] 今日の日記として保存して。
AI: 音声内容を日記エントリとして保存しました:
[2025年3月8日]
今日はチームミーティングがあった。新しいプロジェクトの
スタートだったので少し緊張したけど、チームメンバーが
よくサポートしてくれた...
家計簿との連携:
ユーザー:[shopping-record.mp3 を添付] 今日の買い物を家計簿に記録して。
(音声:「スーパーで食材の買い物をしました。野菜1,500円、お肉3,200円、飲み物800円。」)
AI: 音声から支出項目を認識しました:
- 野菜:1,500円
- お肉:3,200円
- 飲み物:800円
合計5,500円を飲食費として記録しました。
音声ギャラリー
「音声」 タブで、これまでアップロードしたすべての音声ファイルを確認できます。
ギャラリーフィルター
| フィルター | 説明 |
|---|---|
| すべて | すべての音声ファイル |
| アップロード | 直接アップロードしたファイル |
| 生成 | TTSで生成した音声 |
| Webチャット | Web経由で添付したファイル |
| Telegram | Telegram経由で送信したファイル |
ギャラリーでできること
- 音声の再生(ブラウザ内)
- 文字起こしテキストの確認・編集
- ファイル情報の確認(ファイル名、サイズ、アップロード日時)
- ファイルの削除
文字起こしの編集
STTの結果が不正確な場合は、直接編集できます。音声ギャラリーで該当ファイルをクリックすると文字起こしテキストを開いて編集できます。
TTS — AIの応答を音声で聴く
テキストではなく音声でAIの応答を受け取りたい場合に使用します。
ユーザー:今日のスケジュールを読み上げて。
AI: [🔊 音声再生]
「こんにちは!本日2025年3月8日のスケジュールです。
午前10時にチームミーティングがあります。
午後2時にクライアントとのミーティングが予定されています。
午後7時には運動のリマインダーが設定されています。」
使用例
ミーティング録音 → 自動サマリー:
ユーザー:[90min-planning-meeting.mp3 を添付] 10点にまとめて。
AI: 企画ミーティングのサマリー(元の音声:90分):
1. Q3新機能:ソーシャルログインの追加が確定
2. UI改善:ダークモード対応が優先度1位
3. 予算:開発者2名の追加採用が承認
4. スケジュール:ベータ版ローンチ目標は6月30日
5. マーケティング:App Storeの最適化専任チームを設置
...(全10点)
講義録音 → 学習ノート:
ユーザー:[english-lecture.m4a を添付] 知らない単語や表現をまとめて。
AI: 講義から抽出した重要表現:
- "leverage"(活用する):"We need to leverage our existing data"
- "bottleneck"(ボトルネック):"This is a bottleneck in our process"
- "iterate"(繰り返し改善する):"Let's iterate on this design"
全15表現をまとめました。フラッシュカードにしますか?
インタビュー録音 → テキスト整理:
ユーザー:[interview.wav を添付] Q&A形式に整理して。
AI: インタビューQ&A:
Q: 現在の職務で最も重要なことは何だとお考えですか?
A: チームメンバー間のコミュニケーションと信頼関係だと思います...
Q: 今後のキャリア目標は何ですか?
A: 5年以内にテクニカルリーダーに成長することが目標です...
💬 テレグラム使用例
ニオンに自然な言葉で話しかけるだけでOKです。特別なコマンドは不要 — 普段どおりにチャットしてください!
音声メッセージの文字起こし
[音声メッセージを送信] これをテキストにして
→ 音声をテキストに変換します
[会議の録音ファイルを添付] 要約して
→ 録音ファイルをテキストに変換し、要点をまとめます
音声ファイルの活用
[英語の講義録音を添付] 知らない単語をまとめて
→ 講義内容から重要な表現と単語を整理します
[インタビュー録音を添付] Q&A形式にまとめて
→ インタビュー内容を質問と回答の形式に整理します
ヒントとよくある質問
Q. 長時間(1時間以上)のファイルも文字起こしできますか? A. 長いファイルは処理に時間がかかる場合があります。30分以上のファイルは、複数のパートに分割してからアップロードすると処理が速くなります。
Q. 複数人が同時に話すと認識精度が落ちます。 A. 複数人が同時に話したり、背景ノイズが多い場合は精度が低下することがあります。静かな環境で録音されたファイルの方が認識率が高くなります。
Q. 日本語以外の言語も認識されますか? A. 英語、中国語など主要言語に対応しています。複数の言語が混在するファイルもある程度認識されます。
Q. 文字起こしされたテキストをダウンロードできますか? A. 音声ギャラリーで文字起こしを確認してコピーできます。チャットで「文字起こしを見せて」とリクエストすると全内容がテキストとして出力されます。
Q. 通話録音をアップロードできますか? A. 技術的には可能ですが、相手の同意なしに録音された通話の処理は法的問題が生じる可能性があります。お住まいの地域の法律を確認してください。