質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
アルゴリズム

アルゴリズムとは、定められた目的を達成するために、プログラムの理論的な動作を定義するものです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

2回答

3516閲覧

pythonの自動要約について

arimu

総合スコア6

アルゴリズム

アルゴリズムとは、定められた目的を達成するために、プログラムの理論的な動作を定義するものです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

2グッド

3クリップ

投稿2018/01/10 16:28

自動要約について調べていたらこちらのサイトに出くわしたのですが、自動要約

このプログラムは、どの語句が重要かとかを扱うTF-IDF法みたいなのを扱う訳じゃなく、指定した形(200字以内になるや、2文になるようにするなど)になるように作られればどの文章がいい悪い関係なく順に文を抜き出すというプログラムということでよろしいのでしょうか?

間違っていたら、少しだけでいいので説明していただきたく思います。

umyu👍を押しています

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

この Shuca の開発者の方が「自動要約技術」について非常にわかりやすいスライドを公開しているようですので、とりあえずはこちらで理解を深めたらよいのではないでしょうか。

https://www.slideshare.net/hitoshin/automatic-summarization/

私も全く詳しくはないのですが、文ごとに重要度を表すスコアをつけて、指定されたサイズに収まるように「組合せ最適化」で解いているようです。

投稿2018/01/11 00:09

magichan

総合スコア15898

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

どの語句が重要かとかを扱うTF-IDF法みたいなのを扱う

重要度はいろいろと評価があるので扱っていないと断言はできません。

普段どうしているのかは不明ですが、一定以上に重要な単語を全部含むように要約を作ることは可能です。
ここがスタートポイントですね。
更に要約の長さの制限が入った際に情報の密度というものを扱うのが自然なはずです。
非常に重要だけど、非常に長ったらしい文は弾きたいわけです。
密度でいうと連続値になりますが、重要な単語を0.6個入れた文は意味を成さないので、制限付き整数最適化問題になりますよ、とmagichanさんの貼ったリンクで言っているように読めます。

結局、ある単語を入れるかどうかは1か0かの整数で決まっていて、字数制限の制約のもとに、要約の意味を最大化するという意味で「組合せ最適化」の問題で捉えることができるという話のように思います。

投稿2018/01/11 04:29

mkgrei

総合スコア8560

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問