ログインは Google だけ
Voxera 専用のユーザー名とパスワードを覚えてもらう必要はありません。Google ログインだけで簡単に使用することができます。普段から使っているGoogle認証なら、取り忘れや再設定の手間がありません。Pro プランのご購入や、ログイン時だけ使える設定・辞書・履歴の同期も、デスクトップアプリと同じアカウントにまとまるようにしてあります。
他社製品との違い
たいていの音声入力アプリは、カーソル位置にテキストを入力するだけ。 Voxera の Pro プランでは 選択したテキストを主役にしています。Slack やドキュメント、IDE で文章を選んで「短くして」「トーンを整えて」と話した内容を、その場で差し替え。AI で整えてから入れることもできます。無料プランでも、カーソル位置への音声転写やカスタム辞書は使用可能です。 機能は少なめ。 ホットキーはひとつ、画面上にはフローティングバーだけ。 シンプルをモットーにしています
Voxera の機能
既存のアプリは豊富な機能を有するものが数多くありますが Voxera は違います。録音 → テキストにする → いま開いているアプリに反映、これだけです。そして、多くのアプリが二の次にしがちな「テキストを選択してで話す → その部分が書き換わる」を、音声転写と同等に重要視しています。それ以外は、あれば「本当にラクになるなら載せる」という方針です。
Voxera 専用のユーザー名とパスワードを覚えてもらう必要はありません。Google ログインだけで簡単に使用することができます。普段から使っているGoogle認証なら、取り忘れや再設定の手間がありません。Pro プランのご購入や、ログイン時だけ使える設定・辞書・履歴の同期も、デスクトップアプリと同じアカウントにまとまるようにしてあります。
カスタム辞書、ホットキーでの録音・Whisper large クラスの文字起こし精度・テキストの挿入/置換、話した言葉からショートカットや操作へつなぐルーティング、履歴のクラウド同期。Pro プランでは AI による校正、カスタム指示、選んだ範囲への音声指示、画面に映っている単語を参照する画面コンテキスト、辞書の上限拡大などを実装しています。
録音中や文字起こし・校正などの処理中だけ、画面下部に細長いフローティングバーが出ます。待機中は自動で隠れるので、普段は作業画面を狭めません。録音の開始と終了はホットキーで切り替え(修飾キーとキーの組み合わせは設定で変更できます)。無音が続いたときに自動で録音が区切られる動きにも対応しています。マイクやショートカット、辞書などの細かい設定は専用の設定ウィンドウから。テキストが反映されたら、そのまま手元のアプリに集中できます。
2つの操作感
テキストを選択しなければ、ホットキーで録音のオンとオフを切り替えながら話すだけ。文字起こしした文が、いまフォーカスしている入力欄のカーソル位置に入ります。無料プランでもここが主役です。テキストを選択した状態で録音すると、Pro プラン ではその範囲への「指示」として動き、「短くして」「もっとフォーマルに」など、声の内容がその場で反映されます。また、差し込む前に AI が自動で文章校正も行います。同じホットキーで、足す編集と直す編集を行き来できます。
入手する
言語
文字起こしは自動で言語を判別するモードと、特定の言語に固定するモードから選べます。対応は 英語・日本語・中国語・韓国語・ドイツ語・フランス語・スペイン語・ポルトガル語・ロシア語。実際の入力フローまで含めて同じ言語セットで検証しており、数だけ増やした未検証のロケールは載せていません。
仕事の生産性アップために
どのアプリでも手順は同じ。カーソル位置で音声テキストを入力するか、選択したテキストを編集する。音声まわりの一本に力を入れ、不要な機能は省くようにしています。
Slack、メール、Notion、ターミナル、各種IDE など、文字を打つ場所ならどこでも。カーソル位置に流し込むのも、範囲を選択してから声で直すのも(Pro プラン)、同じ入力欄の中で完結します。
フローティングバーは小さく、録音中も画面を圧迫しにくい構造です。一文ずつでも、まとめて口述でも、処理の待ち時間が気になりにくいよう調整しています。
手元のウィンドウに出ている単語を、文字起こしや校正のヒントにします。
プログラマーやライターなどに最適です
あらかじめ設定した言葉を話すことで、登録したショートカットコマンド操作が可能です。辞書に自分のスタック用語を登録することで、ログ行や API 名が文字起こしで潰れにくくなります。
「このフレーズを聞いたらこのキーを送る」と決められます。マクロや送信、エディタのコマンドも、新しいキーバインドを増やさずに実行可能です。
使用感
定型的な入力にかかる時間が短くなり、チャットやメールの返信が早くなります。
チャット・メール・メモ
段落を選択して向けてざっくり話し、整った段落にするのもよし。ぐちゃっとした一行を 選んでから「ビジネス向けに」「Slack 向けにもう少し短く」と 声で頼むのもよし。その場で書き換えが入ります。
企画書・仕様・原稿
頭の中の構成や箇条書きを、そのまま話してドキュメントに落とし込めます。クラウド同期された履歴から、あとで「あの言い回しどう言ったっけ」と探し直すこともできます。
特長
カーソル位置に音声転写と、選択したテキストを声で編集(Pro プラン)の二本柱に付随する機能だけを積んでいます。細かい精度設定や、プライバシーを意識した初期状態、無料枠を超えたら Pro プラン、という段階もはっきりさせています。
Whisper large クラスの環境を想定したモデルを、Voxera 経由で利用できます。 9言語の固定+自動判別(EN / JA / ZH / KO / DE / FR / ES / PT / RU)は、音声転写から選択テキストの編集(Pro プラン)まで、厳しい検証テストに合格しています。
フォーカスしているアプリでテキストを選択し、「こう変えて」と話すとその場でテキストを差し替え。新しく話して足す動きと、選んでから直す動きの両方を、同じ操作系で扱えます。
社名、プロダクト名、略語、コード用語などを登録して、認識結果をブレさせにくくします。
文体や禁止事項、出力のルールをあらかじめ決めておけます。メールとチャットでトーンを変えたいとき、選んだ段落だけルールを当てたいときに効きます。
OS ごとに馴染みやすいホットキーと、テキストの取得方法になっています。カーソル位置への音声転写も、選択したテキストへの操作指示も、それぞれの環境で自然に感じられるよう整えています。
Google でログインすると、設定・辞書・書き起こし履歴がアカウントに紐づいてクラウド同期されます。
ローンチを終えて
公開したばかりのプロダクトです。利用者の声や事例紹介はこれから積み上げていきます。そのうえで、次のようなワークでは特に利便性を感じていただきやすいと考えています。
料金
無料プランは、ベーシックな音声転写と月間5,000文字までご利用いただけます。Pro プランは日常的に使う方向けで、AI 校正、カスタム指示、選択したテキストへの音声指示、辞書の上限800語、など機能性に優れています。
Google でサインインし、決済画面にてお支払い。
図の金額は変更されることがあります。最新の条件はチェックアウト画面をご確認ください。
Windows 版は Microsoft Store から入手できます。 macOS 版は 近日公開の予定です。更新内容は GitHub の Releases にまとまっています。