質問編集履歴

2

agep31

agep31 score 29

2018/10/17 17:17  投稿

strcmp関数を使った文字列の一致について
### 前提・実現したいこと
phpを用いて文字列の一致が判断できるものを作っています。
wikipediaから取得してきた文章を抽出しmecabにより名詞のみを抽出し、あらかじめ作っておいた辞書(jisyo.txt)の中身と一致した場合に"a"と表示したいです。
以下があらかじめ作っておいた辞書です。
<辞書(jisyo.txt)>
テロ
強盗
暴動
クーデター
地雷
殺人
爆弾
テロリスト
ひったくり
盗難
置き引き
”暴力”をwikipediaで検索し取得した文章から”殺人”という名詞を抽出できています。ですので、最後にstrcmp関数を使って辞書と一致しているかforeachを使っているのですが、"a"が表示されません。
### 該当のソースコード
```ここに言語名を入力
<?php
// // キーワード指定/
$keyword = "暴力";
// // APIのURL
$url = "http://wikipedia.simpleapi.net/api?keyword=".urlencode($keyword)."&output=php";
// // データを取得
$data = file_get_contents($url) ;
// // PHPシリアライズパーサーを利用して解析し、配列に入れる
$array = unserialize($data);
echo "<pre>";
//print_r($array);
echo "</pre>";
$text = $array[0]['body'];
echo $text;
$options = array('-d', '/usr/lib/x86_64-linux-gnu/mecab/dic/mecab-ipadic-neologd');
$mecab = new \MeCab\Tagger($options);
$nodes = $mecab->parseToNode($text);
       foreach($nodes as $tmp2){
               if($tmp2->getPosId() == 38 && preg_match("/[^a-zA-Z]+/u", $tmp2->getSurface())){
                       $result[] = $tmp2->getSurface();
               }
       }
$out = array_count_values($result);
arsort($out);
echo "<pre>";
//print_r($out);
echo "</pre>";
//辞書の読み込み
$filename = "jisyo.txt";
$pn = file($filename);
foreach($result as $tmp){
       foreach($pn as $tmp2_pn){
               if(strcmp($str1,$str2) == 0){
               if(strcmp($tmp,$tmp2_pn) == 0){
                       echo "a";
               }
       //echo $tmp."と".$tmp2_pn;
       }
}
```
### 試したこと
文字エンコードの問題かと思って$tmpと$tmp2_pnをmb_convert_encoding関数を使って"utf-8"に直してみたのですが、結果は変わらずでした。
### 補足情報(FW/ツールのバージョンなど)
ubuntu18.04
Apache/2.4.29
PHP 7.2.5
  • PHP

    37446 questions

    PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

1 プログラムの修正を行いました。

agep31

agep31 score 29

2018/10/17 16:58  投稿

strcmp関数を使った文字列の一致について
### 前提・実現したいこと
phpを用いて文字列の一致が判断できるものを作っています。
wikipediaから取得してきた文章を抽出しmecabにより名詞のみを抽出し、あらかじめ作っておいた辞書(jisyo.txt)の中身と一致した場合に"a"と表示したいです。
以下があらかじめ作っておいた辞書です。
<辞書(jisyo.txt)>
テロ
強盗
暴動
クーデター
地雷
殺人
爆弾
テロリスト
ひったくり
盗難
置き引き
”暴力”をwikipediaで検索し取得した文章から”殺人”という名詞を抽出できています。ですので、最後にstrcmp関数を使って辞書と一致しているかforeachを使っているのですが、"a"が表示されません。
### 該当のソースコード
```ここに言語名を入力
<?php
// // キーワード指定/
$keyword = "暴力";
// // APIのURL
$url = "http://wikipedia.simpleapi.net/api?keyword=".urlencode($keyword)."&output=php";
// // データを取得
$data = file_get_contents($url) ;
// // PHPシリアライズパーサーを利用して解析し、配列に入れる
$array = unserialize($data);
echo "<pre>";
//print_r($array);
echo "</pre>";
$text = $array[0]['body'];
echo $text;
$options = array('-d', '/usr/lib/x86_64-linux-gnu/mecab/dic/mecab-ipadic-neologd');
$mecab = new \MeCab\Tagger($options);
$nodes = $mecab->parseToNode($text);
       foreach($nodes as $tmp2){
               if($tmp2->getPosId() == 38 && preg_match("/[^a-zA-Z]+/u", $tmp2->getSurface())){
                       $result[] = $tmp2->getSurface();
               }
       }
$out = array_count_values($result);
arsort($out);
echo "<pre>";
//print_r($out);
echo "</pre>";
//辞書の読み込み
$filename = "jisyo.txt";
$pn = file($filename);
foreach($result as $tmp){
       foreach($pn as $tmp2_pn){
               if(strcmp($str1,$str2) == 0){
                       echo "a";
               }
       //echo $tmp."と".$tmp2_pn;
       }
}  
```
### 試したこと
文字エンコードの問題かと思って$tmpと$tmp2_pnをmb_convert_encoding関数を使って"utf-8"に直してみたのですが、結果は変わらずでした。
### 補足情報(FW/ツールのバージョンなど)
ubuntu18.04
Apache/2.4.29
PHP 7.2.5
  • PHP

    37446 questions

    PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

思考するエンジニアのためのQ&Aサイト「teratail」について詳しく知る