質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.32%

Python3で呼び出されたMecabの結果をWebブラウザ上で表示させたい。

解決済

回答 1

投稿 編集

  • 評価
  • クリップ 0
  • VIEW 691

testcase

score 13

お世話になります。

#!/usr/bin/env python3.4
# -*- coding: utf-8 -*-
from natto import MeCab

mc = MeCab()

text = "おはようございます。"

ma = mc.parse(text)

print("Content-Type: text/html; charset=utf-8\n\n")
print("""
<!DOCTYPE html>
<html>
<head>
<meta charset="utf-8x">
<title>CGIスクリプト</title>
</head>
<body>
<pre>
""")
print(ma)
print("""
</pre>
</body>
</html>
""")


このようなMecabの解析結果をWebブラウザ上で表示するプログラムを書きました。
ファイル名をsample.pyとでもすると、

 % python3 sample.py


と入力すると以下のように表示してくれます。

Content-Type: text/html; charset=utf-8


<!DOCTYPE html>
<html>
<head>
<meta charset="utf-8x">
<title>CGIスクリプト</title>
</head>
<body>
<h1>CGIスクリプト</h1>
<p>これはサーバの実行結果として生成されたHTMLです</p>
<pre>

おはよう    感動詞,*,*,*,*,*,おはよう,オハヨウ,オハヨー
ござい    助動詞,*,*,*,五段・ラ行特殊,連用形,ござる,ゴザイ,ゴザイ
ます    助動詞,*,*,*,特殊・マス,基本形,ます,マス,マス
。    記号,句点,*,*,*,*,。,。,。
EOS

</pre>
</body>
</html>

この結果を、できれば http://hoge.com/sample.pyなどと書いてWebブラウザ上で表示させたいと考えているのですが、上手く表示されません。
サーバはXserverを利用しています。

.htaccessでの設定がおかしいのかと考えましたが、

#!/usr/bin/env python3

import datetime

#フォーマット文字列の作成
html_body = """
<html><body>
{0.year:d}/{0.month:d}/{0.day:d} {0.hour:d}:{0.minute:d}:{0.second:d}
</body></html>"""

now=datetime.datetime.now()

print("Content-type: text/html\n")
print(html_body.format(now))


等も作りましたが、こちらは結果がブラウザ上にきちんと表示されます。
.htaccessはこのように設定しています。

AddHandler cgi-script .py


どのようにすればいいのかご教授いただけますと幸甚です。
よろしくおねがいします。

その後、以下の事柄を試しました。

#!/usr/bin/env python3.4
# -*- coding: utf-8 -*-

import sys
import io
sys.stdout = io.TextIOWrapper(sys.stdout.buffer, encoding='utf-8')
#sys.stdout.write('Content-type: text/html; charset=UTF-8\n\n')

import cgi
# enable debugging
import cgitb
cgitb.enable()

from natto import MeCab

#mc = MeCab.Tagger('-Ochasen')

text = "おはようございます。"

#ma = mc.parse(text)

print("Content-Type: text/html; charset=utf-8\n\n")
print("""
<!DOCTYPE html>
<html>
<head>
<meta charset="utf-8x">
<title>CGIスクリプト</title>
</head>
<body>
<pre>
""")
#print(ma)
print(text)
print("""
</pre>
</body>
</html>
""")

このようにすることで、少なくとも文字コードはUTF-8に統一され、
Mecabを利用しない範囲においては、表示されるようにはなりました。
まだMecabについては上手く表示ができておりませんので、
引き続き試していきたいと思います。

その後、この直上のプログラムで、コメント記号を外した

mc = MeCab.Tagger('-Ochasen')


は、コマンドライン上での実行と併せて

mc = MeCab()


とした方がよいことがわかりました。
しかし、コメント記号を外すと
いずれでも500 internal Server Errorとなります。
ちなみに、このmcをprint文で表示させると、

<natto.mecab.MeCab model=<cdata 'mecab_model_t *' 0x55f5d313c190>, 
 tagger=<cdata 'mecab_t *' 0x55f5d31dc950>, 
 lattice=<cdata 'mecab_lattice_t *' 0x55f5d31463a0>, 
 libpath="/home/.../bin/mecab/lib/libmecab.so", 
 options={}, 
 dicts=[<natto.dictionary.DictionaryInfo dictionary=
 <cdata 'mecab_dictionary_info_t *' 0x55f5d3133660>, 
 filepath="/home/.../bin/mecab/lib/mecab/dic/ipadic/sys.dic", 
  charset=utf-8, type=0>], 
 version=0.996>


このようになります。
引き続き調査します。
よろしくお願いします。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

質問への追記・修正、ベストアンサー選択の依頼

  • KojiDoi

    2018/07/18 03:08

    pythonではなくサーバ設定の問題でしょう。 Xserverではnginx使っているようですから、"nginx cgi 設置" などググって見てはどうでしょう。

    キャンセル

  • testcase

    2018/07/18 03:23

    ありがとうございます。500と返ってきます。エラーログですが、「End of script output before headers: sample.py」と出ます。public_html内でPython関連のディレクトリを作成し、その中で実行しています。nginxってそんな状況なのですね。ありがとうございます。調べてみます。

    キャンセル

  • testcase

    2018/07/19 21:48

    FCGIについて調べました。fcgiwrapをインストールしようと考え、git cloneでダウンロードしてからautoreconfした後、configureすると、checking for 「FCGX_Init in -lfcgi... no」となって、configureできませんでした。これにつきましてご教示いただけませんでしょうか?よろしくお願いします。

    キャンセル

回答 1

checkベストアンサー

+1

ずっと内部エラーのままじゃしょうがないので、とりあえずtracebackでも見てみませんか。

#!/usr/bin/env python3.4
# -*- coding: utf-8 -*-

import sys
import io
sys.stdout = io.TextIOWrapper(sys.stdout.buffer, encoding='utf-8')
#sys.stdout.write('Content-type: text/html; charset=UTF-8\n\n')

import cgi
# enable debugging
import cgitb
cgitb.enable()

from natto import MeCab
import traceback



text = "おはようございます。"

try:
    mc = MeCab.Tagger('-Ochasen')
    ma = mc.parse(text)
except:
    traceback_txt = traceback.format_exc()

print("Content-Type: text/html; charset=utf-8\n\n")
print("""
<!DOCTYPE html>
<html>
<head>
<meta charset="utf-8x">
<title>CGIスクリプト</title>
</head>
<body>
<pre>
""")
#print(ma)
print(text)
print(traceback_txt)
print("""
</pre>
</body>
</html>
""")

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2018/08/03 01:36

    ありがとうございます。
    以下のようにできました!

    おはようございます。
    おはよう 感動詞,*,*,*,*,*,おはよう,オハヨウ,オハヨー
    ござい 助動詞,*,*,*,五段・ラ行特殊,連用形,ござる,ゴザイ,ゴザイ
    ます 助動詞,*,*,*,特殊・マス,基本形,ます,マス,マス
    。 記号,句点,*,*,*,*,。,。,。
    EOS

    最初、import osした際に,
    osでのpathの値をそのまま使えばいけると思い込んでいましたので、
    上手く表示できない際には、osライブラリは使えないのかと勘違いしてました。

    import os
    os.environ['MECAB_PATH'] = '/home/.../bin/mecab/lib/libmecab.so'
    os.environ['MECAB_CHARSET'] = 'utf8'

    と、こんな感じで書いてやる必要があったということでした。

    どうもありがとうございました!

    キャンセル

  • 2018/08/03 01:43 編集

    natto-pyのreadmeとかでそうしろって書いてあるんですか・・・
    なんでそれで行けるのかわからない(汗)なんかwebサーバ側でごにょごにょしないとダメかなぁ、とか思ってたんですが
    あと、ずいぶんナイーブなCGIですが、これから拡張していくならセキュリティとか気をつけてくださいね(ユーザの入力を受け取って~とかやりだすと色々考えるべきことが多いですね)。実験目的で、すぐ潰す予定のページとかならそこまでシビアに考える必要はないかもですけど

    キャンセル

  • 2018/08/07 10:58

    お返事が遅くなりまして申し訳ありません。
    そうですね、とりあえずは技術獲得のレベルですので、このままでは怖いですね。
    またよろしくお願いいたします。
    お忙しい中ありがとうございました。

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 90.32%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

同じタグがついた質問を見る