Skip to content

yosinn1-blip/api-voice-input

API音声ソフト

AIに話しかけるための、Mac向け高速音声入力アプリです。

ChatGPT / Claude / Codex などの入力欄に、FnEnter だけで素早く音声入力します。文章を過度に整えるより、話した意図を速く正確にAIへ渡すことを重視しています。

特徴

  • AI入力向けのシンプルな音声入力
  • Groq Whisper whisper-large-v3-turbo による高速な文字起こし
  • アプリ独自アカウント不要
  • ユーザー自身のGroq APIキーを使用
  • APIキーはmacOS Keychainに保存
  • 録音中はコンパクトな波形overlayを表示
  • overlayに×/チェックなどのクリック用ボタンを置かず、キー操作だけで完結
  • Fn → Fn は入力欄へ貼り付けのみ
  • Fn → Enter は貼り付け後にEnter送信

ダウンロード

使い方ページ: https://yosinn1-blip.github.io/api-voice-input/

最新版はGitHub Releasesからダウンロードできます。

このアプリはメニューバー常駐型です。起動しても通常のウィンドウは開かず、画面上部のメニューバーに 🎙 が表示されます。

必要環境

  • macOS 14以降
  • GroqアカウントとAPIキー
  • マイク権限
  • アクセシビリティ権限

初回セットアップ

  1. API音声ソフト.app を開きます。
  2. macOSに止められる場合は、Finderで右クリックして 開く を選びます。
  3. マイク権限を許可します。
  4. アクセシビリティ権限を許可します。
  5. メニューバーの 🎙 から 無料のGroq APIキーを取得 を選びます。
  6. GroqでAPIキーを作成し、コピーします。
  7. Groq APIキーを設定… から貼り付けて保存します。

APIキーはMacのKeychainに保存されます。

使い方

  1. ChatGPT / Claude / Codex などの入力欄をクリックします。
  2. Fn を押して録音を開始します。
  3. 話します。
  4. 入力欄に入れるだけなら、もう一度 Fn を押します。
  5. そのまま送信したいなら、Enter を押します。

このアプリは画面上の×/チェックボタンをクリックする設計ではありません。FnEnter を覚える代わりに、視線を入力欄から外さずに操作できます。

長い文章を Fn → Enter で送る場合は、貼り付け完了を待つために自動Enter送信まで少しだけ待ちます。もし送信されない場合は、もう一度 Enter を押してください。

Groq無料API枠の目安

このアプリは whisper-large-v3-turbo を使います。Groq公式のRate Limitsでは、無料枠の目安として次の制限が案内されています。

  • 1分あたり最大20回
  • 1日あたり最大2,000回
  • 音声は1時間あたり最大7,200秒、つまり約2時間分
  • 音声は1日あたり最大28,800秒、つまり約8時間分

このアプリでは、基本的に Fn → 話す → Fn または Fn → 話す → Enter の1回がAPIリクエスト1回です。

たとえば平均15秒で話すなら、音声時間だけで見ると1日約1,900回分です。平均30秒なら約960回分です。実際には1日2,000回のリクエスト上限もあるため、短い入力を大量に使う場合は回数上限に先に当たる可能性があります。

日常的なAIチャット入力ならかなり余裕がありますが、会議文字起こしのように長時間連続で使う用途では上限に近づきやすいです。最新の正確な値はGroq ConsoleのLimitsページを確認してください。

YouTube一時停止オプション

メニューの 録音開始時にYouTubeを一時停止 は、公開向け初期状態ではオフです。

オンにすると、録音開始時にブラウザやmacOSのメディア情報を使ってYouTubeの一時停止を試みます。この機能は追加のmacOS許可ダイアログが出ることがあり、環境によって動作が異なります。

Chromeで動画を確実に一時停止したい場合は、Chromeのメニューバーから 表示デベロッパーApple Events からの JavaScript を許可 をオンにしてください。これがオフの場合、アプリは動画の一時停止ではなく、一時的なシステム音声ミュートへフォールバックすることがあります。

通常の音声入力だけならオフのままで問題ありません。

配布について

このMVPは直接配布用です。App Store版やnotarize済み版ではありません。

そのため、初回起動時にmacOSのGatekeeper警告が出る場合があります。公開配布を強める場合は、Apple Developer IDでのnotarizationが次の作業です。

開発者向け

swift test
./scripts/dev-cycle.sh
./scripts/package-release.sh

release ZIPは dist/ に作成されます。

プライバシー

詳しくは PRIVACY.md を参照してください。

About

Mac menu bar voice input app for AI text boxes using Groq Whisper

Resources

Code of conduct

Contributing

Security policy

Stars

Watchers

Forks

Packages

 
 
 

Contributors