コンピュータ(TIPS)

文字起こしのソフトで1番読み取りが正確なのは?実際の音声データを使って検証

会議で必要になる議事録。書くのはかなり面倒です。
録音した会話を聞き直すのも大変。

そんなことから、どうやったら簡単に文字起こしができるか調べてやってみました。

グーグルの検索結果で、高評価を得ている3つの方法をやってみましたが、どれもイマイチでした。

そんな中で、いまのところ、ベストと思える方法を見つけたので、やり方を含めてご紹介します。

検索で見つけた3つの無料の文字起こし方法を検証した結果は?

今回、実績のありそうな、3つの方法を検証するにあたり、音声データとしてこちらの講演の音声を5分使いました。

iphoneで記録したものなので、音声はあまり大きくなく、ノイズもあって、咳や資料をめくる音などが入っています。

逆に言うと、一般的の人が録音できるレベルです。

検証1.グーグルドキュメント

検索で、いちばんに出てくるのは、この方法です。

【完全無料】全自動文字起こしの決定版!音声や動画を再生するだけで文字起こしをする方法

この方法で、該当の音声を認識させると、

ご覧のとおり、洗剤のあたりで、部分で、音声認識が止まってしまいます。


何度やっても駄目です。 同じところで止まります。

グーグルドキュメントの音声認識は、認識率は高いのですが、途中で止まってしまうという欠点があります。

原因は、音声データの質の悪さです。

ためしに、youtubeのIHIの会社案内を文字起こしさせてみると、こんなに99%正確に文字起こしをしてくれました。


IHI は1853年石川島造船所として創業以来160年以上にわたりものづくり技術への挑戦を行ってきましたまさに IHI の歴史は日本の重工業の歴史高いエンジニアリング力を通して社会の発展に貢献できると思う重工業へと成長してまいりました現在多様化する社会インフラ家族する高度情報化複雑化する世界経済と私たちを取り巻く環境は猛スピードで変化していますこれらはお客様の求める価値も多様化していることを意味しています IHI グループはこの変化を確実に捉えお客様の価値創造のために四つの事業領域を通して取り組んでいます資源エネルギー環境事業領域では大型ボイラーガスタービンなどの発電分野の製品やプロセスプラント環境関連製品などを提供豊富なノウハウと独自技術により産業の発展や豊かな生活に欠かせないエネルギーの安定供給と地球温暖化抑制に寄与しています

検証2.speechnotes

こちらは、グーグルと同じエンジンを使っていて、さらに途中で認識が止まる事がないという事だったので、試してみました。

でも、結果は同じでした。グーグルは洗剤が嫌いなのでしょうか?(笑)


検証3.Recoco

アプリも試してみました。 認識率が9割と紹介されていた、iphoneアプリのRecocoですが、ご覧のとおりです。

YoutubeのIHIの会社案内を、再生して聞かせると、

一応、聞き取っていますが、グーグルドキュメントほど正確でない。

他にも有料のドラゴンスピーチなどが良いと書かれていますが、有料版だからといって、もし同じような結果の場合になったらと思うと、怖くて買う事ができません。

かなり正確に文字起こしをしてくれる裏技的方法を発見

この方法を発見したのは、単なる偶然でした。文字起こしをしようと思っていたわけではいのですが、先の講演の音声も、かなり正確に文字にする事ができました。

その方法は、youtubeです。

Youtubeでの、文字起こし方法のやり方

まず、mp3やm4aなどの音声データの場合、youtubeにアップロードできるように、mp4などの動画に変換します。

映像は特に必要ないので、黒い画像でも入れておけばよいです。

→音声データから、動画をつくる方法。(準備中)

次に、この動画をアップロードします。 他人に知られたくないデータならば、非公開でOKです。

アップロードが完了してから、5~10分ほど時間をあけてから、右上のロゴから、youtube studioを選びます。

動画をクリックして、動画の一覧をだします。

アップロードした動画を選んだら、以前の機能が見つからないから、文字起こしを選びます

公開済み 日本語(自動)というボタンが出現します。ここをクリックします

※アップロードした直後は、ここが空欄ですので、5~10分ほど待ってリロードましょう。

再生ボタンを押すと、画面に字幕が表示されていきます。

あの洗剤で止まってしまっていた音声も、最後までテキストとして文字表示されます

そしたら12時ぐらいになったら駅前ですからいろんな方がうちの店の前はリアルわけ
ですね
この方とはどういう形がというとお腹を空かしている方です
じゃあ私にとってはこれは
洗剤にね
お腹空かしています
だけどもお腹しかしていくは全員市からやりくるかというとそんな保証有りませんね
ニーズがさまざ
うどんがいい人もいればコンビニの弁当がいい人もいればいろいろです
じゃあ私お何をするかヒアリングするわけですね
歩いてるひとつか
もしも承認しはくっ
中空いてませんです
なりたらいいんですいい
は1ます
頭のこの短い昼休みにお店に入ったらそうで出来ですぐ食べ
そこそこ美味しい食べ物って何か想像つきますか
昼休みにちょっといい黒2月陥れで a 汗かいて昼からの仕事を頑張れる食べものっ
て何かありましたっけ
ちっちゃい時にあの遊びに行って夕方帰っていたらお母さん作ってくれたら一番上しか
モデル食べもある何でしたっけ

いうと答える人がいい
じゃあこのカレーの皮膚になっていいかなと
じゃあこの方はカレーを食べた人に変わるわけです
ここぜんざいです
想像させるように聞いてい
お腹をしかしてる人は洗剤に
カレーを食べたいという意思を持ってる人は健在
私は何を言いたいかというと
潜在ニーズの段階で飛びついてプレゼンして売れないということ
お腹空かしている人に強引に捕まえるうちの店連れ込んでもカレーは食べないという
ことですね
ヒアリングによってカレーを食べたいという意志を持った人に初めて
や実は家からやんですよ言ったら入ってただけください
ということはこの潜在ニーズが顕在ニーズに変わった変わり目を見誤っては撃沈すると
いう
私は20代のころ売れない営業マン時代
お客様の潜在ニーズがちらっと見える箇所が1泊と食いついていると優先していました
うちもあるパスできると思う事いいましたね採用するにはこれをせていただくと絶対
大丈夫ですよ
ラインナップはこれ価格はこれパフェとか調べ
ap 一方的に
んでしょうね
で激遅これは繰り返していました
30代に入って
我慢のヒアリングを覚えたんです
これいいことだと思いませんガンマンの悲哀にいる
私だけ本当にもが1の悲哀無題
これを覚えますよねでそれがを出せない自分にノルマを課しましょう
何度も何度かというとお客様のニーズが顕在化するまではプレゼンは絶対にしない
本文のキレイ
それからなんです
ヒアリングがものすごい比率濃くなってきたのか人が分かりました
それからなんですね決定率が高くなってきた
無駄打ちがなくなってきました
プレゼンすればほぼ決まるぐらいまでに
高めてなるノルマを
それからの営業
おもしろいなと思い始めた
ですからそういう意味で言うとその子のニーズの潜在化から顕在化していく
かわいいよね上になると
でこの変わりならどうやって見極めていくのかです
これは商談中にお客様が何げなく出す会のサイン
これを見ようとさないということです
ものすごい集中力でそのサインを見落とさないようです
この際は何なのか
何してもその変化を
サスーンの楽しいね

だからよく止められない
はいということで以上まいんどはまずはおさらいしますよね
営業
プライドを持ってもらいさまよいましょう
それからもう一つは他の諸不平等は経験できないものね
面白さを私たち毎日感じることができるんだという
こういうマインドね
たいなと思います
では次のページスキルに入っていきましょう
[拍手]
あった
サブタイトル位
慌てるねーよをもらいやすく無いん
気丈な仕事上ずなりと

今からね遡ること約20年前でしょうかね
私がちょうど30歳ちょい
一つの大きな転機があったんですね
でまぁ今から振り返るとあの飛行
私の営業スタイルが全く変わっていきました
そういう風に言うとあの日が私
の営業マンとしての音以外目の誕生日ぐらい
たいしますけれども
何があったかと言いますと

右上の編集ボタンを押すと、テキストを修正できるので、音声を聞きながら、誤字脱字はここで手直ししてしまうのが良いでしょう。

さて、起こした文字をコピペするには、ひと工夫必要になります。

まず、操作のボタンを押して、ダウンロードができるのですが、3つの見慣れない形式が並んでいます。

まず、.stv を選んで字幕データをダウンロードします。この時、拡張子をstvからtxtに書き換えてしまいましょう。

すると、txtでダウンロードできますので、メモ帳で開く事ができます。

字幕用のタイムコードも行間に入っています。

これらを除去します。

メモ帳で開いたら、全部を選択して、エクセルに貼り付けます。

あとは、フィルターを使用して、「0:」で始まる行を除外すれば、綺麗なテキストファイルのできあがりです。

句点が入らないので、読みやすいように調整する必要はあります。

いかがでしょうか?

youtubeを使った文字起こしの、メリット・デメリット

・質の悪い音声データでも、受け付けてくれる。
・アップロードするだけで、あとは待つだけ。
・修正も、音声を聞きながら、画面上でできる。
・音声の切れ間で、改行が入る。

・音声データを動画データにしないとアップロードできない。
・テキストファイルに落とすのに、一手間かかる。

お願い

このサンプルの音声を、もっと精度よく自動で文字にしてくれるソフトやツールがありましたら、ご一報ください

COMMENT