iphone等で撮った動画内に映っている数字やテキストがあった場合、抽出するということは技術的に可能なのでしょうか?
ブラウザで再生してる最中とかにjavascript等でテキストがあったら抽出。みたいなことが出来たら理想です。
技術的に可能なのかどうかもわかりませんが、アドバイスいただければと思ってます。
Linuxは、Unixをベースにして開発されたオペレーティングシステムです。日本では「リナックス」と呼ばれています。 主にWebサーバやDNSサーバ、イントラネットなどのサーバ用OSとして利用されています。 上位500のスーパーコンピュータの90%以上はLinuxを使用しています。 携帯端末用のプラットフォームAndroidは、Linuxカーネル上に構築されています。
PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。
Swiftは、アップルのiOSおよびOS Xのためのプログラミング言語で、Objective-CやObjective-C++と共存することが意図されています
iPhoneとは、アップル社が開発・販売しているスマートフォンです。 同社のデジタルオーディオプレーヤーiPodの機能、電話機能、インターネットやメールなどのWeb通信機能の3つをドッキングした機器です。
FFmpegは、動画と音声を交換できるフリーソフトウェアです。UNIX系OSから派生した、MS-DOSから操作するコマンドラインツールです。libavcodecやlibavformat、libswscale、libavfilterなどを含みます。ライセンスは、コンパイルの際のオプションによりLGPLもしくはGPLに決定されます。対応コーデックや使用できるオプションが多く、幅広く利用されています。
Linuxは、Unixをベースにして開発されたオペレーティングシステムです。日本では「リナックス」と呼ばれています。 主にWebサーバやDNSサーバ、イントラネットなどのサーバ用OSとして利用されています。 上位500のスーパーコンピュータの90%以上はLinuxを使用しています。 携帯端末用のプラットフォームAndroidは、Linuxカーネル上に構築されています。
PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。
Swiftは、アップルのiOSおよびOS Xのためのプログラミング言語で、Objective-CやObjective-C++と共存することが意図されています
iPhoneとは、アップル社が開発・販売しているスマートフォンです。 同社のデジタルオーディオプレーヤーiPodの機能、電話機能、インターネットやメールなどのWeb通信機能の3つをドッキングした機器です。
FFmpegは、動画と音声を交換できるフリーソフトウェアです。UNIX系OSから派生した、MS-DOSから操作するコマンドラインツールです。libavcodecやlibavformat、libswscale、libavfilterなどを含みます。ライセンスは、コンパイルの際のオプションによりLGPLもしくはGPLに決定されます。対応コーデックや使用できるオプションが多く、幅広く利用されています。
0グッド
1クリップ
投稿2015/10/25 10:48
iphone等で撮った動画内に映っている数字やテキストがあった場合、抽出するということは技術的に可能なのでしょうか?
ブラウザで再生してる最中とかにjavascript等でテキストがあったら抽出。みたいなことが出来たら理想です。
技術的に可能なのかどうかもわかりませんが、アドバイスいただければと思ってます。
気になる質問をクリップする
クリップした質問は、後からいつでもMYページで確認できます。
またクリップした質問に回答があった際、通知やメールを受け取ることができます。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
回答2件
0
字幕とかではなくて、動画中の看板とかモニタの中とか、車のナンバープレートとかそういうのですよね?
角度によって変形するし、光源の加減でノイズが入るし、フォントも色も一定じゃないし困難だとは思います。
掲示板に投稿するときの画像文字認証の文字を瞬時に解析するような技術が要求されると思います。
音声からのテキスト起こしと似たようなもので、何処までの解読精度を求めるかと、誤字脱字をどの程度許容できるかについて、開発工数と折り合いをつける必要が出てきそうですね。
ブラウザで再生してる最中とかにjavascript等でテキストがあったら抽出
何処までアバウトさを許容できるかだと思います。
javascriptだけだと速的にも厳しそうに思います。将来的なバージョンでの機能拡張とハードの速度向上をまつべきかも知れませんね。遅延が出てもよければサーバへデータ送ってサーバ側プログラムで解析して送り返す…でもきつそうですね。
明瞭な文字ならごく稀に何文字かテキスト起こしが出きる…かも?くらいまでいけたらいいほうかも?
将来を見越したデモプログラムとか
アルゴリズムは郵便局の住所読み取り機械の延長とかでいけるのかな?ずっと困難になりそうですが……
投稿2015/10/25 16:23
編集2015/10/25 16:31総合スコア2068
あなたの回答
tips
太字
斜体
打ち消し線
見出し
引用テキストの挿入
コードの挿入
リンクの挿入
リストの挿入
番号リストの挿入
表の挿入
水平線の挿入
プレビュー
質問の解決につながる回答をしましょう。 サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。 また、読む側のことを考えた、分かりやすい文章を心がけましょう。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。