Mac版Codexの音声入力はかなり実用的だった|自作MLX Whisperと比べて分かった使い分け

Mac版Codexの音声入力と自作MLX Whisperを比較し、導入の手軽さや速度、ローカル処理の違いを示したアイキャッチ画像 AI
本サイトはプロモーションが含まれています

Codexアプリが驚くべき進化をしていました!

なんとCodex内だけではなく、Macのどこでも音声入力ができるようになっていました!
ホットキーで呼び出せて、辞書登録もでき、履歴も残る。長めの指示文も入れやすい。

Macで高精度な音声入力を使いたいなら、まずCodexアプリの音声入力を試してみる価値があります。

私はこれまで、MLXとmlx-whisperを使って、Mac用のローカル音声入力環境を自作してきました。だからこそ、Codexの音声入力がMac上で使えるようになって、「これが無料でええんか?」と驚きました(もちろんChatGPTの有料ユーザーである必要はあるけれど)

  • 自作Whisperを置き換えられるのか。
  • ローカル音声入力を使い続ける意味は残るのか。
  • どちらをどの場面で使えばよいのか。

この記事では、その点を整理します。


Codexの音声入力を使う設定方法

Codexアプリから音声入力を設定しているスクリーンショット。

Codexアプリを開いて、左下の歯車マークの設定をクリックします。

あとは一般を開き、下に移動して「音声入力」の欄から好きなキーを割り当てていきます。


Codexの音声入力の機能

項目確認できた内容
押している間だけ録音するホットキーキーを押している間だけ音声入力できる
トグル式の音声入力1回押して開始、もう1回押して停止できる
音声入力辞書単語やフレーズを登録できる
履歴直近の入力内容を数件確認できる

私の設定では、左のoptキーを押している間だけ音声入力できるようにしています。


Codex音声入力が便利だった理由

一番の強みは、導入の軽さです。

自作のWhisper音声入力では、Python環境、venv、MLX、mlx-whisper、モデル選定、録音処理、文字起こし後の貼り付け処理、macOSの権限設定、ホットキーの調整と、少なくともこれだけの準備が必要でした。

これはこれで楽しい作業です。自分専用の道具を育てていく感覚があります。ただ、単に「Macで高精度な音声入力を使いたい」だけなら、かなり重い出発点です。

その点、Codexの音声入力は手軽でした。私の環境では、設定から有効化してホットキーを決めるだけで使い始められました。

使っていて便利だと感じたのは、句読点が比較的自然に入ること、長めの文章を入れやすいこと、固有名詞を辞書で補正しやすいこと、履歴から直近の入力を見返せること、そしてホットキーで呼び出せるため入力欄を移動しても使いやすいことです。十分すぎるほどの機能です。

この手軽さでこの精度の音声入力ができるって…
既存の有料音声入力アプリは淘汰される可能性大ですわ。


Mac標準の音声入力と比べるとどうか

Mac標準の音声入力も便利です。追加アプリなしで使えますし、短いメモや簡単な検索には十分役立ちます。環境によっては、これだけで足りる人も多いはずです。

ですが精度が圧倒的に違います。Codexの音声入力の圧勝です。

Codex音声入力を体験すると、Mac標準の音声入力なんて周回遅れのテクノロジーって感じです。Appleさん、ここ数年何やってたんだよ?と思っちゃうくらいに、Codexの音声入力は優れています。


自作MLX Whisperと比べるとどうか

本題はここです。

Codex音声入力がここまで便利なら、自作MLX Whisperは不要になるのか。私の結論は、不要にはならない、です。ただし、役割はかなり分かれます。

観点Codex音声入力自作MLX Whisper
導入のしやすさ高い。設定すればすぐ使いやすい低い。環境構築が必要
入力できる範囲Macの入力欄ならどこでもMacの入力欄ならどこでも
速度十分実用的。ただし待ち時間を感じる場面ありM4 iMacではこちらの方が速く感じる場面あり
安定性ネットワークやサービス側状況の影響を受ける可能性があるMac本体の性能に依存しやすい
プライバシー処理場所を公式情報だけでは断定しにくいローカル完結の構成にできる
辞書・補正アプリ側の機能として使いやすい自分で自由に作れる
カスタマイズ性仕様の範囲内高い
保守アプリ側の更新に任せられる自分で直す必要がある
向いている用途日常入力、AIへの長文指示機密入力、高速入力、独自ルール重視

Codexは、完成品として強いです。設定が簡単で、すぐ使えて、複数の入力欄に入れられる。辞書や履歴も最初から用意されています。多くの人にとっては、これだけで十分かもしれません。

一方、自作MLX Whisperは、道具として育てられるのが強みです。録音時間の扱い、無音判定、貼り付け方法、特定語句の補正、誤入力の破棄、後処理のルールなどを、自分の用途に合わせて詰められます。

完成品としての手軽さならCodex。
制御できる道具としての強さなら自作Whisper。

自作音声入力ツールはこちらの記事を参考にしてください。
mlx-whisperでMac音声入力を自作|ローカル環境で使う方法


いちばん大事なのは、音声データの扱い

音声入力で最も慎重に考えるべきなのは、音声データの扱いです。

自作MLX Whisperであれば、構成次第で録音から文字起こしまでをMac上で完結できます。つまり、音声を外部APIに送らない運用が可能です。

一方、Codexアプリの音声入力についてはサーバー側で処理されています。つまり音声データーが外部に送られるということです。

実務的には、次のように考えるのが安全です。

  • Codex音声入力は便利に使う
  • 機密情報や外に出したくない内容は話さない
  • その用途では自作MLX Whisperを使う
  • 履歴に残る内容にも注意する

でもどこぞのよく分からない音声入力アプリを使うくらいであれば、OpenAIなので比較的安心かと思います。



速度は自作MLX Whisperに分がある場面もある

Codex音声入力は遅すぎるわけではありません。日常的に使える速度です。ただ、私のM4 iMac上で動かしている自作MLX Whisperと比べると、話し終えてから文字が確定するまでの待ち時間が少し長く感じる場面がありました。

この差は、音声入力では意外とストレスです。話して、止めて、すぐ文字が出る。このテンポがよいほど、音声入力は気持ちよく使えます。

Codex側の処理にネットワークやサーバー側の要素が含まれるなら、時間帯や通信状況の影響を受ける可能性もあります。一方、自作MLX WhisperはMac本体の性能に依存するため、M4 iMacのようにローカル推論が速い環境では、この差が体感として出やすいのかもしれません。

ただしこれはベンチマークではなく、モデル、音声の長さ、ネットワーク環境、話し方によって結果は変わります。あくまで私の使い方では、レイテンシの気持ちよさは自作MLX Whisperの方が上でした。

Codexはサーバー処理なので、サーバーの混み具合によって音声入力が反映されるまでの時間が変わる時があります。


どちらを選ぶべきか

判断はシンプルです。

Codex音声入力が向いている人

  • すぐに使い始めたい
  • Python環境を作りたくない
  • Mac上の複数の入力欄で音声入力したい
  • AIへの長文プロンプト入力を楽にしたい
  • 辞書や履歴を最初から使いたい
  • 細かい制御より完成品としての便利さを重視したい

自作MLX Whisperが向いている人

  • 音声を外に出したくない
  • ローカル完結にしたい
  • 待ち時間をできるだけ減らしたい
  • 独自の補正ルールを作りたい
  • 誤入力の破棄や後処理を細かく制御したい
  • 自分用の道具として育てたい

用途別にまとめると次のようになります。

用途おすすめ
AIへの長文プロンプト入力Codex音声入力
Google検索やメモCodex音声入力
記事の下書きCodex音声入力
外に出したくない内容自作MLX Whisper
速度を最優先する入力自作MLX Whisper
独自の辞書補正や後処理自作MLX Whisper
お高めのMacを使っていてメモリにも余裕があるなら自作MLX Whisper

基本、Codexでいいと思います。


結論:まずCodex。機密性と制御性が必要なら自作MLX Whisper

現時点での私の結論は、かなりはっきりしています。

まず試すならCodex音声入力です。導入が簡単で、ホットキーで呼び出せて、私の環境では複数アプリの入力欄で使えました。辞書と履歴もあり、AIへの長文指示やブログ下書きには十分実用的です。

ただし、自作MLX Whisperの価値がなくなったわけではありません。むしろCodexを使ったことで、自作Whisperに残る価値がはっきりしました。

  • ローカルで動かせること。
  • 速く確定できること。
  • 自分のルールで補正できること。
  • 機密情報を扱う入力に回せること。

この4点です。

日常入力やAIへの指示はCodex。機密性、速度、制御性が必要な場面は自作MLX Whisper。今のところ、この使い分けがいちばん現実的です。

参考までに。それでは!


参考リンク

OpenAI|Introducing the Codex app
https://openai.com/index/introducing-the-codex-app/

OpenAI Help|音声入力 – よくある質問
https://help.openai.com/ja-jp/articles/12168547-voice-dictation-faq

コメント