質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.48%

  • PHP

    20813questions

    PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

  • Mecab

    178questions

    Mecabは、オープンソースの形態素解析エンジンです。 言語、辞書、コーパスに依存しない汎用的な設計を基本方針としています。 Mecabの由来は、開発者の好物である和布蕪(めかぶ)から名づけられました。

igo-phpを用いた形態素解析がサーバー上で解析されない。

解決済

回答 1

投稿 編集

  • 評価
  • クリップ 0
  • VIEW 1,385

web_yasu

score 9

igo-phpを用いた形態素解析を作成しています。

環境は以下のURLを参考に構築いたしました。
http://life-collections.com/dev/programming/php_make_tag_cloud_with_igo_php

ローカルのXAMPP上では形態素解析された状態で結果を返します。
この時点では、igo-phpはMecabの辞書を使い結果を返しているようです。
cmd igo-php Mecab

しかし、サーバー上では形態素解析されない状態で結果を返します。

  • 「すもももももももものうち」の場合は、分かち書きされない状態で結果を返します。
  • 「私は誰?」の場合は、全て名詞として認識された状態で結果を返します。

辞書がうまく読み込めていない、もしくは、アップロード時に壊れてしまっていると予想しています。
しかし、打開策が見つからず質問させていただきました。

ディレクトリ構成は以下のようにいたしました。

└test.php(下記のソース記述ファイル)
└igo-php
 └libIgo.php
  └ipadic

test.phpのソースコード

header("Content-Type: text/html; charset=UTF-8");

require_once 'igo-php/lib/Igo.php';
$igo = new Igo("./igo-php/lib/ipadic", "UTF-8");

$testtext = "すもももももももものうち";

# 単語のみを取得する
$result = $igo->wakati($testtext);
echo "<pre>";
print_r($result);
echo "</pre>";

# 品詞等補足情報も取得する
$result = $igo->parse($testtext);
echo "<pre>";
print_r($result);
echo "</pre>";


$testtext = "私は誰?";

# 単語のみを取得する
$result = $igo->wakati($testtext);
echo "<pre>";
print_r($result);
echo "</pre>";

# 品詞等補足情報も取得する
$result = $igo->parse($testtext);
echo "<pre>";
print_r($result);
echo "</pre>";

出力結果は以下のようになります。

Array
(
    [0] => すもももももももものうち
)
Array
(
    [0] => Morpheme Object
        (
            [surface] => すもももももももものうち
            [feature] => 名詞,一般,*,*,*,*,*
            [start] => 0
        )

)
Array
(
    [0] => 私
    [1] => は
    [2] => 誰
    [3] => ?
)
Array
(
    [0] => Morpheme Object
        (
            [surface] => 私
            [feature] => 名詞,一般,*,*,*,*,*
            [start] => 0
        )

    [1] => Morpheme Object
        (
            [surface] => は
            [feature] => 名詞,一般,*,*,*,*,*
            [start] => 1
        )

    [2] => Morpheme Object
        (
            [surface] => 誰
            [feature] => 名詞,一般,*,*,*,*,*
            [start] => 2
        )

    [3] => Morpheme Object
        (
            [surface] => ?
            [feature] => 名詞,サ変接続,*,*,*,*,*
            [start] => 3
        )

)

試したこと

  • 載せるサーバーを変更してみました。
  • 文字コードをEUC-JPに変更してみました。
  • ファイル全てをパーミッションを705にしてみました。
  • error_reporting(-1); >> エラーは出力されません。
  • ini_set('error_reporting', E_ALL); >> エラーは出力されません。
  • ini_set('memory_limit', '128M'); >> を設定して見ました。
  • ipadicのコンパイル時に文字コードをUTF-8に変更してみました。
  • コンパイルに使用するjarファイルを1つ前のバージョンのigo-0.4.3.jarにしてコンパイルしてみました。(現在はigo-0.4.5.jar)

この質問に対する回答でなくてもかまいません。
どこを疑ったら良いのか、なにを調べたら良いのかだけでもお願いします。

以上となります。
よろしくお願いいたします。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 1

check解決した方法

+1

自己解決しました。

辞書ファイル(ipadicフォルダ)をFileZillaの転送モードを自動にしてアップロードしていました。それをバイナリに変更しアップロードすることにより形態素解析され出力することができました。

投稿

編集

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

関連した質問

同じタグがついた質問を見る

  • PHP

    20813questions

    PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

  • Mecab

    178questions

    Mecabは、オープンソースの形態素解析エンジンです。 言語、辞書、コーパスに依存しない汎用的な設計を基本方針としています。 Mecabの由来は、開発者の好物である和布蕪(めかぶ)から名づけられました。