動画からの文字起こし作業を音声入力でやってみました。

こんにちは。MAKING THE ROAD / i-3の明星浩一です。

今回初めて動画からの文字起こし作業をやってみました。
やってみての感想等を簡単にですが共有します。

作業内容は、先日開催したイベントの動画(約45分)からトーク内容を書き起こす、というものです。

YouTubeに限定公開された動画を元に書き起こしていきます。

※今回書き起こした内容はこちらです。

ちょっと試したけどダメそうだった方法

どうやったら簡単にできるかなと思っていくつかの方法を試しました。

やり始めてすぐに気づかされた難しさは…
「話し言葉、めちゃくちゃ速い…!」ということです。

普段話していてそう感じることはありませんが、文字起こしをしようと思うと、なかなか大変なスピードでした。

再生速度を0.75倍速にしていましたが、タイピングでついていくのは容易ではありませんでした。打つのが速い人ならついていけるものなのでしょうか?

0.75倍速でも速いと感じましたが、0.5倍速まで速度を落とすと音が割れて聞きづらかったため、0.75倍速で書き起こすことにしました。

さて、まずはダメだった方法から紹介します。

①PCで動画を再生してPCのキーボードで入力

画面の左側で動画を再生しながら右側でタイピングをしようと思いましたが、これはダメでした。
画面左で動画を再生して、右でタイピングして、左で止めて30秒戻して、右でタイピングして…とマウスの操作だけでも面倒すぎました。
これでは最後まで終わる気がしなかったので、断念。

②スマホで動画を再生してPCのキーボードで入力

これは①と同じく、ふつうに面倒くさかったです。
手がスマホとPCを行ったり来たりするので、作業が遅々として進みませんでした。

③テレビで動画を再生してPCのキーボードで入力

「手がタイピングに専念出来れば良いかな」と考え、TVにYouTubeをキャストして試してみました。
(TVはChromecast経由でGoogle Homeにつないであります。)

「OK Google, 30秒戻して」「OK Google, 一時停止して」とかってやってみたのですが、とてもじゃないけど無理でした。
指示を発声するのにかかる数秒と、指示が実行されるまでの数秒がかなりのロスでした。

④スマホで動画を再生してGoogleドキュメントで音声入力

次は、「音声入力使えないかな?」と考えて、動画の音声をPCに聞かせてみました。
認識しませんでした…。残念。
複数の人間の声と会場音があるので、難しいんでしょうか。
手持ちのビデオカメラで、マイクなしの肉声を拾っていたので、なかなか難易度高かったかもしれません。

今回試した中ではいちばん良かった方法

⑤スマホで再生、聞いたことをそのまましゃべって、音声入力

今回はこの方法でなんとか書き起こすことが出来ました。
まずは、Googleドキュメントで「ツール」から「音声入力」を選択します。

イヤホンでYouTubeの音声を聞きながら、同じ内容をPCに向かって話します。
手はスマホの操作のみ、入力はGoogleドキュメントさんにお任せです。

下の動画を見て頂くとわかりますが、簡単な日本語なら精度バッチリです。


え、めっちゃ楽ですやん…!

あとは、聞いて→止めて→話す、聞いて→止めて→話す、の繰り返しです。
まあまあな精度で入力していってくれますので、かなり楽でした。

ちなみにこの後は
・改行
・誤字脱字の修正
・話者の名前入れ
・文体の修整
等の作業が待っていますので、結構時間はかかりましたが、なんとか文字起こしは完了しました。

まとめと気づき

・最近の音声入力は賢い。

今回はGoogleドキュメント以外のものを試していませんが、これで充分すぎました。
音声入力を使うと手が空くので、手は動画を止めたり戻したりすることに専念できました。
少なくとも私の場合は、手入力より確実に速いです。
あとは、音声データから直接文字起こし出来ると、もっと助かりますね。

・話し言葉をそのまま文字に起こすと意味が通らない。

日本語は語順が入れ替わっても意味が通じてしまう言語なので、私たちは普段かなり自由な語順で話しているのでしょうね。
話した言葉をそのまま書き起こしても、意味が通らず読むのに不向きな文章になってしまいました。話しているその場ではもちろん通じるんですけどね。
普段いかに「単語の意味」と「コンテクスト」に頼った会話をしているか、ということを考えさせられました。日本語難しい。

・修整作業は時間がかかる。

誤字の修正、句読点の追加、漢字/かなの統一、あたりにはやはりそれなりの時間がかかります。
あと、サイトにアップするにあたっては、名前を太字にしたり改行の調整にも多少時間がかかりました。

・読むのは見る/聞くよりも速い。

文字起こしとは直接関係ありませんが、情報をインプットする上での「読む」という行為の効率の良さを感じました。
45分の動画を視聴するのには45分程度かかりますが、内容を読むのは5分かそこらしかかかりませんからね。文字、強い。

ということで、今回の作業は時間がかかりましたが、楽しかったです。
また何かあったら文字起こししてみようかなと思いました。

以上です。お付き合いありがとうございました。

 COMMENT

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

手伝って楽しむ人

書家の方に名刺の名前を書いてもらったら、こうなりました。

起業して1年が経ちました。

1人増えたらコミュニケーションの経路が3つ増えた話(イベントのお知らせあり!)

%d人のブロガーが「いいね」をつけました。