質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.52%

  • Python

    7953questions

    Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

自動要約プログラム、lexRankについての質問です。

解決済

回答 2

投稿

  • 評価
  • クリップ 0
  • VIEW 1,337

初歩的な質問で申し訳ありません。

リクルートテクノロジーズが、公開している自動要約API(https://recruit-tech.co.jp/blog/2015/10/30/summpy-released/)を実際に手持ちのパソコン(環境、spyder)で動かしてみたいのですが具体的にどのようにしたらいいのでしょうか?

*以下、読まなくて大丈夫です。
やってみたこと、
githubからダウンロードする。
spyder3でlexrank.pyファイルを開く。実行ボタンを押す。
これでは動かないことはなんとなくわかりました。
pythonでhelloWorldを作ってみたら、コンソール上にいつも通り現れたので、ようやく内容もコンソール上に現れるのだろうとは思うのですが...
lexrankのプログラムの内容は何となくみて、入力値がただのテキストではなく、閾値や文の数などがあることはわかるのですが、それはどう設定したらいいのかわからなく...

python自体をほぼ使ったことがない上に、spyder3も使いこなせていないので教えていただけたらと思います。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 2

checkベストアンサー

+2

Win10+Anaconda環境で試してみました。

まずPython2.7環境で
> pip install summpy
します。Requirementsにあるパッケージも同時にインストールされるようです。
当方はすでにMeCab導入済みでしたが、MeCab or janomeは自力でインストール&セッティング必要かもしれません。

次に
> python -m summpy.server -h 127.0.0.1 -p 8080
で要約サーバを起動します。

以下のようなスクリプトで実際に要約サーバにリクエストすると

import requests
p = { 'sent_limit':'3', 'text':'NHKは11日、塚本堅一アナウンサー(37)が危険ドラッグを所持していたとして、厚生労働省関東信越厚生局麻薬取締部に医薬品医療機器法違反の疑いで10日に逮捕された、と発表した。麻薬取締部によると、塚本容疑者は容疑を認めているという。逮捕容疑は、10日、自宅で危険ドラッグを所持していたというもの。同部は自分で使用する目的だったとみている。NHKの説明では、塚本容疑者は2003年入局。京都放送局などを経て、15年2月から東京のアナウンス室所属。「ニュース シブ5時」でリポーターを務めていた。NHKは「職員が逮捕されたことは遺憾であり、視聴者の皆様や関係者に深くおわびいたします。事実関係を調べたうえで厳正に対処します」とコメントを出した'}
r = requests.get('http://localhost:8080/summarize', params=p)
print( r.text)


"error": "add_edge() takes exactly 3 arguments (4 given)"というエラー文字列がjsonで返ってきてしまいます。

エラーでググってみるとSummpyを使ってみたらエラーが出たのでが見つかるので、これに従い

pip install networkx==1.11
pip install multiqc==1.2

してもう一度試すと、以下のように無事?結果が得られました。

{
  "debug_info": {},
  "summary": [
    "NHKは11日、塚本堅一アナウンサー(37)が危険ドラッグを所持していたとして、厚生労働省関東信越厚生局麻薬取締部に医薬品医療機器法違反の疑いで10日に逮捕された、と発表した
。",
    "麻薬取締部によると、塚本容疑者は容疑を認めているという。",
    "NHKの説明では、塚本容疑者は2003年入局。"
  ]
}


参考まで。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

0

中身は見てないので、gitの情報そのままのせますが・・・
web APIで動かすだけでよければ、quick startのとおりにやればよいかと。

https://github.com/recruit-tech/summpy

 Quick Start

pip install summpy
python -m summpy.server -h 127.0.0.1 -p 8080
curl http://127.0.0.1:8080/summarize\?sent_limit\=3\&text\=要約したい文章を入力。

コンソールでやるなら、中身見て確認してください。

おっと失礼。summpyを実行したかったわけじゃないのですね・・・
とはいえ、上記のquick startで環境は構築できるはずなので、あとは、こことか見ながら試してみては、どうでしょう。
lexRank.py でググるといろいろでてきますね。

投稿

編集

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 90.52%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

同じタグがついた質問を見る

  • Python

    7953questions

    Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。