GoogleドキュメントでMP3・MP4・音声データを文字起こしする方法

google

「録音したMP3をGoogleドキュメントで文字起こしできないかな?」と思ったことはありませんか?
実は、Googleドキュメントにはファイルをアップロードして自動変換する機能はありません。
しかし、PCの音声設定を少し変えるだけで、録音済みの音声データや動画をそのまま文字起こしに活用できます。
この記事では、WindowsとMac別の具体的な手順から、精度を上げるコツ、うまくいかないときの対処法まで解説します。


スポンサーリンク

Googleドキュメントの音声入力とは

Googleドキュメントには「音声入力」という機能が標準搭載されています。
マイクに向かって話すと、リアルタイムで文字に変換してドキュメントに書き込んでいく仕組みです。

基本的な使い方

  1. Google ChromeでGoogleドキュメントを開く
  2. 「ツール」→「音声入力」をクリックする(ショートカット:Windows Ctrl+Shift+S / Mac ⌘+Shift+S
  3. 画面左側にマイクのアイコンが表示されるのを確認する
  4. マイクアイコンをクリックして入力開始(アイコンが赤くなれば認識中)
  5. 終了するときは再度マイクアイコンをクリックする

重要な前提:音声入力はGoogle Chromeでのみ動作します。
EdgeやFirefoxを使っているとメニューに「音声入力」の項目自体が表示されないため、必ずChromeでアクセスしてください。


MP3・MP4を直接アップロードして変換はできない

Googleドキュメントの音声入力は、あくまでマイクから入力された音声をリアルタイムでテキスト化する機能です。
そのため、以下の操作には対応していません。

  • MP3ファイルをドキュメントにアップロードして自動変換
  • MP4(動画ファイル)の音声を直接読み込んで文字起こし

音声データから文字起こしするには、「音声ファイルを再生しながら、その音をマイクが拾う状態」を作る必要があります。
具体的な方法は以下の3つです。


方法1:2台のデバイスを使う(最も手軽・初心者向け)

PCやスマホが2台あれば、設定の変更なしに手軽に試せる方法です。

手順

  1. 1台目のPC(またはスマホ)でGoogleドキュメントを開き、音声入力をスタートする
  2. 2台目のデバイス(スマホ・別のPCなど)で音声ファイル(MP3/MP4)を再生する
  3. 2台目のスピーカーを1台目のマイクに近づけ、音声を拾わせる

向いている場合: 設定を変更したくない場合、手軽に試してみたい場合

注意点: スピーカーと内蔵マイクの距離・音量によって精度が大きく変わります。
静かな環境で、スピーカーをマイクに近づけた状態で実行しましょう。


方法2:Windowsのステレオミキサーを使う

Windowsには「ステレオミキサー」という機能があり、PC内部で再生している音声をそのままマイク入力として扱えます。
これを有効にすることで、MP3やMP4を再生しながら音声入力が可能になります。

ステレオミキサーを有効にする手順(Windows 11)

  1. タスクバーのスピーカーアイコンを右クリックし、「サウンドの設定」を選択する
  2. 「サウンドの詳細設定」をクリックする
  3. 「録音」タブを開く
  4. 「ステレオミキサー」が表示されない場合は、リスト内の空白部分を右クリックして「無効なデバイスの表示」にチェックを入れる(グレーで表示されます)
  5. 「ステレオミキサー」をダブルクリックし、デバイスの使用状況を「このデバイスを使用する(有効)」に変更して「適用」→「OK」をクリックする
  6. ステレオミキサーを右クリックし、「既定のデバイスとして設定」を選択する

Windows 10の場合: 手順1で「サウンドの設定」ではなく「サウンド」を選択し、「録音」タブへ進んでください。

文字起こしの手順

  1. 上記の設定が完了したら、Google ChromeでGoogleドキュメントを開く
  2. 「ツール」→「音声入力」でマイクアイコンを起動し、アイコンをクリックして音声入力を開始する
  3. PCでMP3またはMP4ファイルを再生する
  4. 音声がリアルタイムでテキスト化される

注意点: ステレオミキサーが搭載されていないPCもあります(Realtek製オーディオドライバーに依存)。
表示されない場合は、PCメーカーの公式サイトから最新のオーディオドライバーをインストールするか、後述の仮想オーディオデバイスを使う方法をお試しください。


方法3:Macで仮想オーディオデバイスを使う

MacにはWindowsのステレオミキサーに相当する機能が標準搭載されていません。
代わりに、無料の仮想オーディオデバイスアプリを使ってPC内部の音をマイク入力として扱います。

主な無料アプリ(公式サイトからダウンロード可能)

おおまかな流れ

  1. 上記のいずれかのアプリをインストールする
  2. システム設定からサウンドの入力デバイスをインストールしたアプリに変更する
  3. Google ChromeでGoogleドキュメントを開き、音声入力を起動する
  4. MP3またはMP4ファイルを再生する

各アプリの詳細な設定手順はアプリごとに異なります。
公式サイトまたはアプリのドキュメントを参照しながら設定してください。


文字起こしの精度を上げるコツ

どの方法でも、音声の質が精度に直結します。
以下の点を意識するだけで、誤変換が大幅に減ります。

音量を適切に設定する
音量が小さすぎると認識されず、大きすぎると音割れが起きます。
音声入力中、マイクアイコン周辺に音声が検知されているか確認しながら音量を調整しましょう。

静かな環境で作業する
周囲の話し声、エアコンの風切り音、交通音などが混入すると誤認識が増えます。
できるだけ静かな部屋で、窓やドアを閉めて作業しましょう。

安定したインターネット接続を使う
Googleドキュメントの音声認識はオンライン処理のため、回線が不安定だと認識が止まることがあります。
Wi-Fiが不安定な場合は有線接続を試してみてください。

内蔵マイクより外付けマイクを使う
PC内蔵マイクは環境音を拾いやすく、精度が安定しません。
ヘッドセットや外付けマイクを使うと、話者の音声をクリアに拾えます(方法2・3の場合は外付けマイクが不要な場合もあります)。


うまくいかないときの確認ポイント

「ツール」に「音声入力」が表示されない
ブラウザがGoogle Chrome以外の可能性があります。
ChromeでGoogleドキュメントを開き直してください。

マイクアイコンをクリックしても反応しない
ブラウザのマイク許可が「ブロック」になっている可能性があります。
ChromeのURLバー左側のアイコンをクリックして「マイク」の権限を「許可」に変更し、ページを再読み込みしてください。

音声入力が途中で止まる
一定時間無音が続くと自動停止することがあります。
再度マイクアイコンをクリックして再開してください。
長時間の音声データは、一定区間ずつに分けて処理するとスムーズです。

ステレオミキサーが「録音」タブに表示されない(Windows)
空白部分を右クリックして「無効なデバイスの表示」を選択してもリストに出てこない場合は、ステレオミキサー機能がPCに搭載されていない可能性があります。
PCメーカーの公式サイトからオーディオドライバーを再インストールするか、仮想オーディオデバイス(VB-CABLEなど)の使用を検討してください。


まとめ

GoogleドキュメントはMP3・MP4ファイルを直接アップロードして自動変換する機能を持っていないため、音声をマイクで拾う形式をとる必要があります。
最も手軽なのは2台のデバイスを使う方法で、Windowsならステレオミキサーの有効化、Macなら仮想オーディオデバイスのインストールで1台のPCで完結できます。
精度は「音量」「静かな環境」「安定したネット接続」の3点が大きく影響するため、環境を整えてから実行するのがおすすめです。
より高精度な文字起こしや話者識別が必要な場合は、専用の文字起こしツールの利用も検討してみてください。


参考情報源:

コメント

タイトルとURLをコピーしました