質問編集履歴
2
var_dumpでの出力に変更しました。
title
CHANGED
File without changes
|
body
CHANGED
@@ -4,71 +4,101 @@
|
|
4
4
|
形態素解析にはmecabを使っているのですが、特定の品詞のみを抽出する方法がわかりません。
|
5
5
|
preg_match関数を使い正規表現で「地域」と判断された単語を抽出したいです。
|
6
6
|
|
7
|
-
<出力結果>
|
8
|
-
|
9
|
-
|
10
|
-
|
11
|
-
|
12
|
-
|
13
|
-
|
14
|
-
|
15
|
-
|
16
|
-
|
17
|
-
|
18
|
-
|
19
|
-
|
20
|
-
|
21
|
-
|
22
|
-
|
23
|
-
|
24
|
-
|
25
|
-
|
26
|
-
|
27
|
-
|
28
|
-
|
29
|
-
|
30
|
-
|
31
|
-
|
32
|
-
|
33
|
-
|
34
|
-
|
35
|
-
|
36
|
-
|
37
|
-
|
38
|
-
|
39
|
-
|
40
|
-
|
41
|
-
|
42
|
-
|
43
|
-
|
44
|
-
|
45
|
-
|
46
|
-
|
47
|
-
|
48
|
-
|
49
|
-
|
50
|
-
|
51
|
-
|
52
|
-
|
53
|
-
|
54
|
-
|
55
|
-
|
56
|
-
|
57
|
-
|
58
|
-
|
59
|
-
|
60
|
-
|
61
|
-
|
62
|
-
|
63
|
-
|
64
|
-
|
65
|
-
|
66
|
-
|
67
|
-
|
68
|
-
|
69
|
-
|
70
|
-
|
71
|
-
|
7
|
+
<var_dumpでの出力結果>
|
8
|
+
array(31) {
|
9
|
+
[0]=>
|
10
|
+
string(41) "#★< 名詞,サ変接続,*,*,*,*,*
|
11
|
+
"
|
12
|
+
[1]=>
|
13
|
+
string(73) "成田 名詞,固有名詞,地域,一般,*,*,成田,ナリタ,ナリタ
|
14
|
+
"
|
15
|
+
[2]=>
|
16
|
+
string(63) "午前 名詞,副詞可能,*,*,*,*,午前,ゴゼン,ゴゼン
|
17
|
+
"
|
18
|
+
[3]=>
|
19
|
+
string(50) "発 名詞,接尾,一般,*,*,*,発,ハツ,ハツ
|
20
|
+
"
|
21
|
+
[4]=>
|
22
|
+
string(33) "/ 名詞,サ変接続,*,*,*,*,*
|
23
|
+
"
|
24
|
+
[5]=>
|
25
|
+
string(79) "香港 名詞,固有名詞,地域,一般,*,*,香港,ホンコン,ホンコン
|
26
|
+
"
|
27
|
+
[6]=>
|
28
|
+
string(57) "午後 名詞,副詞可能,*,*,*,*,午後,ゴゴ,ゴゴ
|
29
|
+
"
|
30
|
+
[7]=>
|
31
|
+
string(50) "発 名詞,接尾,一般,*,*,*,発,ハツ,ハツ
|
32
|
+
"
|
33
|
+
[8]=>
|
34
|
+
string(42) "> 記号,括弧閉,*,*,*,*,>,>,>
|
35
|
+
"
|
36
|
+
[9]=>
|
37
|
+
string(59) "デラックスクラスホテル 名詞,一般,*,*,*,*,*
|
38
|
+
"
|
39
|
+
[10]=>
|
40
|
+
string(47) "に 助詞,格助詞,一般,*,*,*,に,ニ,ニ
|
41
|
+
"
|
42
|
+
[11]=>
|
43
|
+
string(42) "3 名詞,数,*,*,*,*,3,サン,サン
|
44
|
+
"
|
45
|
+
[12]=>
|
46
|
+
string(53) "連 名詞,接尾,助数詞,*,*,*,連,レン,レン
|
47
|
+
"
|
48
|
+
[13]=>
|
49
|
+
string(51) "泊 名詞,サ変接続,*,*,*,*,泊,ハク,ハク
|
50
|
+
"
|
51
|
+
[14]=>
|
52
|
+
string(35) "♪ 名詞,サ変接続,*,*,*,*,*
|
53
|
+
"
|
54
|
+
[15]=>
|
55
|
+
string(79) "香港 名詞,固有名詞,地域,一般,*,*,香港,ホンコン,ホンコン
|
56
|
+
"
|
57
|
+
[16]=>
|
58
|
+
string(79) "マカオ 名詞,固有名詞,地域,一般,*,*,マカオ,マカオ,マカオ
|
59
|
+
"
|
60
|
+
[17]=>
|
61
|
+
string(63) "黄金 名詞,一般,*,*,*,*,黄金,オウゴン,オーゴン
|
62
|
+
"
|
63
|
+
[18]=>
|
64
|
+
string(63) "海岸 名詞,一般,*,*,*,*,海岸,カイガン,カイガン
|
65
|
+
"
|
66
|
+
[19]=>
|
67
|
+
string(69) "物語 名詞,一般,*,*,*,*,物語,モノガタリ,モノガタリ
|
68
|
+
"
|
69
|
+
[20]=>
|
70
|
+
string(28) "II 名詞,一般,*,*,*,*,*
|
71
|
+
"
|
72
|
+
[21]=>
|
73
|
+
string(24) "4 名詞,数,*,*,*,*,*
|
74
|
+
"
|
75
|
+
[22]=>
|
76
|
+
string(71) "日間 名詞,接尾,助数詞,*,*,*,日間,ニチカン,ニチカン
|
77
|
+
"
|
78
|
+
[23]=>
|
79
|
+
string(33) "( 名詞,サ変接続,*,*,*,*,*
|
80
|
+
"
|
81
|
+
[24]=>
|
82
|
+
string(28) "NT 名詞,一般,*,*,*,*,*
|
83
|
+
"
|
84
|
+
[25]=>
|
85
|
+
string(27) "2531 名詞,数,*,*,*,*,*
|
86
|
+
"
|
87
|
+
[26]=>
|
88
|
+
string(27) "A 名詞,一般,*,*,*,*,*
|
89
|
+
"
|
90
|
+
[27]=>
|
91
|
+
string(36) ")| 名詞,サ変接続,*,*,*,*,*
|
92
|
+
"
|
93
|
+
[28]=>
|
94
|
+
string(134) "阪急交通社 名詞,固有名詞,組織,*,*,*,阪急交通社,ハンキュウコウツウシャ,ハンキューコーツーシャ
|
95
|
+
"
|
96
|
+
[29]=>
|
97
|
+
string(5) "EOS
|
98
|
+
"
|
99
|
+
[30]=>
|
100
|
+
bool(false)
|
101
|
+
}
|
72
102
|
### 該当のソースコード
|
73
103
|
```
|
74
104
|
<?php
|
1
出力結果を載せました。
title
CHANGED
File without changes
|
body
CHANGED
@@ -4,6 +4,71 @@
|
|
4
4
|
形態素解析にはmecabを使っているのですが、特定の品詞のみを抽出する方法がわかりません。
|
5
5
|
preg_match関数を使い正規表現で「地域」と判断された単語を抽出したいです。
|
6
6
|
|
7
|
+
<出力結果>
|
8
|
+
Array
|
9
|
+
(
|
10
|
+
[0] => #★< 名詞,サ変接続,*,*,*,*,*
|
11
|
+
|
12
|
+
[1] => 成田 名詞,固有名詞,地域,一般,*,*,成田,ナリタ,ナリタ
|
13
|
+
|
14
|
+
[2] => 午前 名詞,副詞可能,*,*,*,*,午前,ゴゼン,ゴゼン
|
15
|
+
|
16
|
+
[3] => 発 名詞,接尾,一般,*,*,*,発,ハツ,ハツ
|
17
|
+
|
18
|
+
[4] => / 名詞,サ変接続,*,*,*,*,*
|
19
|
+
|
20
|
+
[5] => 香港 名詞,固有名詞,地域,一般,*,*,香港,ホンコン,ホンコン
|
21
|
+
|
22
|
+
[6] => 午後 名詞,副詞可能,*,*,*,*,午後,ゴゴ,ゴゴ
|
23
|
+
|
24
|
+
[7] => 発 名詞,接尾,一般,*,*,*,発,ハツ,ハツ
|
25
|
+
|
26
|
+
[8] => > 記号,括弧閉,*,*,*,*,>,>,>
|
27
|
+
|
28
|
+
[9] => デラックスクラスホテル 名詞,一般,*,*,*,*,*
|
29
|
+
|
30
|
+
[10] => に 助詞,格助詞,一般,*,*,*,に,ニ,ニ
|
31
|
+
|
32
|
+
[11] => 3 名詞,数,*,*,*,*,3,サン,サン
|
33
|
+
|
34
|
+
[12] => 連 名詞,接尾,助数詞,*,*,*,連,レン,レン
|
35
|
+
|
36
|
+
[13] => 泊 名詞,サ変接続,*,*,*,*,泊,ハク,ハク
|
37
|
+
|
38
|
+
[14] => ♪ 名詞,サ変接続,*,*,*,*,*
|
39
|
+
|
40
|
+
[15] => 香港 名詞,固有名詞,地域,一般,*,*,香港,ホンコン,ホンコン
|
41
|
+
|
42
|
+
[16] => マカオ 名詞,固有名詞,地域,一般,*,*,マカオ,マカオ,マカオ
|
43
|
+
|
44
|
+
[17] => 黄金 名詞,一般,*,*,*,*,黄金,オウゴン,オーゴン
|
45
|
+
|
46
|
+
[18] => 海岸 名詞,一般,*,*,*,*,海岸,カイガン,カイガン
|
47
|
+
|
48
|
+
[19] => 物語 名詞,一般,*,*,*,*,物語,モノガタリ,モノガタリ
|
49
|
+
|
50
|
+
[20] => II 名詞,一般,*,*,*,*,*
|
51
|
+
|
52
|
+
[21] => 4 名詞,数,*,*,*,*,*
|
53
|
+
|
54
|
+
[22] => 日間 名詞,接尾,助数詞,*,*,*,日間,ニチカン,ニチカン
|
55
|
+
|
56
|
+
[23] => ( 名詞,サ変接続,*,*,*,*,*
|
57
|
+
|
58
|
+
[24] => NT 名詞,一般,*,*,*,*,*
|
59
|
+
|
60
|
+
[25] => 2531 名詞,数,*,*,*,*,*
|
61
|
+
|
62
|
+
[26] => A 名詞,一般,*,*,*,*,*
|
63
|
+
|
64
|
+
[27] => )| 名詞,サ変接続,*,*,*,*,*
|
65
|
+
|
66
|
+
[28] => 阪急交通社 名詞,固有名詞,組織,*,*,*,阪急交通社,ハンキュウコウツウシャ,ハンキューコーツーシャ
|
67
|
+
|
68
|
+
[29] => EOS
|
69
|
+
|
70
|
+
[30] =>
|
71
|
+
)
|
7
72
|
### 該当のソースコード
|
8
73
|
```
|
9
74
|
<?php
|