質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Linux

Linuxは、Unixをベースにして開発されたオペレーティングシステムです。日本では「リナックス」と呼ばれています。 主にWebサーバやDNSサーバ、イントラネットなどのサーバ用OSとして利用されています。 上位500のスーパーコンピュータの90%以上はLinuxを使用しています。 携帯端末用のプラットフォームAndroidは、Linuxカーネル上に構築されています。

PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

Swift

Swiftは、アップルのiOSおよびOS Xのためのプログラミング言語で、Objective-CやObjective-C++と共存することが意図されています

iPhone

iPhoneとは、アップル社が開発・販売しているスマートフォンです。 同社のデジタルオーディオプレーヤーiPodの機能、電話機能、インターネットやメールなどのWeb通信機能の3つをドッキングした機器です。

FFmpeg

FFmpegは、動画と音声を交換できるフリーソフトウェアです。UNIX系OSから派生した、MS-DOSから操作するコマンドラインツールです。libavcodecやlibavformat、libswscale、libavfilterなどを含みます。ライセンスは、コンパイルの際のオプションによりLGPLもしくはGPLに決定されます。対応コーデックや使用できるオプションが多く、幅広く利用されています。

Q&A

2回答

5196閲覧

動画のテキスト抽出

jonny55

総合スコア10

Linux

Linuxは、Unixをベースにして開発されたオペレーティングシステムです。日本では「リナックス」と呼ばれています。 主にWebサーバやDNSサーバ、イントラネットなどのサーバ用OSとして利用されています。 上位500のスーパーコンピュータの90%以上はLinuxを使用しています。 携帯端末用のプラットフォームAndroidは、Linuxカーネル上に構築されています。

PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

Swift

Swiftは、アップルのiOSおよびOS Xのためのプログラミング言語で、Objective-CやObjective-C++と共存することが意図されています

iPhone

iPhoneとは、アップル社が開発・販売しているスマートフォンです。 同社のデジタルオーディオプレーヤーiPodの機能、電話機能、インターネットやメールなどのWeb通信機能の3つをドッキングした機器です。

FFmpeg

FFmpegは、動画と音声を交換できるフリーソフトウェアです。UNIX系OSから派生した、MS-DOSから操作するコマンドラインツールです。libavcodecやlibavformat、libswscale、libavfilterなどを含みます。ライセンスは、コンパイルの際のオプションによりLGPLもしくはGPLに決定されます。対応コーデックや使用できるオプションが多く、幅広く利用されています。

0グッド

1クリップ

投稿2015/10/25 10:48

iphone等で撮った動画内に映っている数字やテキストがあった場合、抽出するということは技術的に可能なのでしょうか?

ブラウザで再生してる最中とかにjavascript等でテキストがあったら抽出。みたいなことが出来たら理想です。

技術的に可能なのかどうかもわかりませんが、アドバイスいただければと思ってます。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

字幕とかではなくて、動画中の看板とかモニタの中とか、車のナンバープレートとかそういうのですよね?
角度によって変形するし、光源の加減でノイズが入るし、フォントも色も一定じゃないし困難だとは思います。
掲示板に投稿するときの画像文字認証の文字を瞬時に解析するような技術が要求されると思います。
音声からのテキスト起こしと似たようなもので、何処までの解読精度を求めるかと、誤字脱字をどの程度許容できるかについて、開発工数と折り合いをつける必要が出てきそうですね。

ブラウザで再生してる最中とかにjavascript等でテキストがあったら抽出

何処までアバウトさを許容できるかだと思います。
javascriptだけだと速的にも厳しそうに思います。将来的なバージョンでの機能拡張とハードの速度向上をまつべきかも知れませんね。遅延が出てもよければサーバへデータ送ってサーバ側プログラムで解析して送り返す…でもきつそうですね。
明瞭な文字ならごく稀に何文字かテキスト起こしが出きる…かも?くらいまでいけたらいいほうかも?
将来を見越したデモプログラムとか

アルゴリズムは郵便局の住所読み取り機械の延長とかでいけるのかな?ずっと困難になりそうですが……

投稿2015/10/25 16:23

編集2015/10/25 16:31
hirohiro

総合スコア2068

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

可能かどうかといえば可能ですが、動画を動かしたままテキストを判定してというとかなり難しいです。
もちろん専用のハードとかあれば、可能ですが。
個人のPCだと難しいですね。
カメラ固定で、文字を映し続けているのならば可能だとは思いますが。
やるとしたら、文字が表示されたら、その場面のスクリーンショットをとって、OCRで読み取るという形になるでしょうか。
文字を読み取る以上、解像度はそれなりに必要となります。

投稿2015/10/25 10:58

hide0527

総合スコア144

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問