質問編集履歴

1

適当でない内容に対しての変更を行いました。

2016/08/31 20:15

投稿

seel
seel

スコア25

test CHANGED
@@ -1 +1 @@
1
- サイトseoについて
1
+ sedの正規表現について
test CHANGED
@@ -1,173 +1,31 @@
1
+ linuxのbashにてsedでhtmlタグ内の文字列を正規表現で指定したいのですが
2
+
1
- お世話にります
3
+ その記述がいまいちよくわからいので教えてください
2
4
 
3
5
 
4
6
 
5
- 新規domain取得して商品紹介系のHPを作りまた。
7
+ 下記<tag1>内にある任意の文字列抽出して改行
6
8
 
7
- 新規domainなのでアクセスがあまり来ないです。
8
-
9
- 最低限のページャはつけました。
10
-
11
-
12
-
13
- googlewebmastertoolを設定して
14
-
15
- アナリティクスもつけました。
16
-
17
-
18
-
19
- 取ったばかりの新規ドメインはコンテンツ完成・公開から一ヶ月未満です。
20
-
21
-
22
-
23
- ```html
24
-
25
- <meta name="keywords" content="HTML,CSS,XML,JavaScript">
26
-
27
- ```
28
-
29
- このkeywordは空白にしました。
30
-
31
- なぜかというと全てのページで同じkeywordを設定してしまうと
32
-
33
- スパムになると考えたからです。
34
-
35
-
36
-
37
- それでも設定しないよりは設定したほうがいいかもしれないということで
38
-
39
- 設定するとなるとスパムにならない・かぶらないキーワードを各ページに
40
-
41
- 割り当てる必要が出てきました。
42
-
43
-
44
-
45
- そこでプログラムでキーワードを設たいと考えています。
9
+ そこに<tag2>を設してその中に任意の文字列を置換しています。
46
-
47
-
48
-
49
- 環境は
50
-
51
-
52
-
53
- centos6.7
54
-
55
- php5.6
56
-
57
- 端末 bash
58
-
59
- html
60
10
 
61
11
 
62
12
 
63
13
 
64
14
 
65
- できれば端末上で多数のページに対して
15
+ ```bash
66
16
 
67
-
68
-
69
- ```html
70
-
71
- <meta name="keywords" content="$keyword1,$keyword2,$keyword3">
17
+ sed 's|<tag1>.*</tag1>|<tag1>.*</tag1>\n<tag2>.*</tag2>|g'
72
18
 
73
19
  ```
74
20
 
75
21
 
76
22
 
77
- 該当htmlに書かれている日本語キーワードを単語程度の長さ分だけに抽出
23
+ ここで使われている.*は使用できませんでた。
78
-
79
- それを$keywordに代入したい(書き換えたい)と思っています。
80
24
 
81
25
 
82
26
 
83
- ローカルファイルに直接置換する形で行いたいと思っているのですが
27
+ それともう一つ知りたいがあるのですが
84
28
 
29
+ 任意の文字列のn番目のヒットを対象とする表現もできますでしょうか
85
30
 
86
-
87
- googleではこの<meta name="keywords"をクローラーは無視している
88
-
89
- らしいのですが、もしこの設定が有効なおであればそうしたいと思っています。
90
-
91
- おおよそどのくらいでindexがくる感じなのでしょうか。
92
-
93
- 実際はどうなんでょう
31
+ よろくご教授お願い致します
94
-
95
-
96
-
97
- まだ新規ドメイン取得後一ヶ月未満なので
98
-
99
- 例えば100ページあったとしたなら20ページくらいしかインデックスされていません。
100
-
101
-
102
-
103
-
104
-
105
- やったこと:
106
-
107
-
108
-
109
- サーバー構築
110
-
111
- 独自ドメイン取得・反映
112
-
113
- googlewebmastertool 所有権の確認
114
-
115
- googleアナリティクスの設置
116
-
117
- コンテンツの作成
118
-
119
- アップロード
120
-
121
-
122
-
123
-
124
-
125
- これからやろうとしていること:
126
-
127
-
128
-
129
- ```html
130
-
131
- <title>$title</title>
132
-
133
- <meta name="keywords" content="$keyword1,$keyword2,$keyword3">
134
-
135
- ```
136
-
137
- これら(ローカルファイル)すべてにプログラムで重複しないように取得し置換する。
138
-
139
-
140
-
141
- (そのページからキーワードを拾って代入する)(日本語)です。)
142
-
143
-
144
-
145
-
146
-
147
-
148
-
149
- ```html
150
-
151
- <title>$パソコン</title>
152
-
153
- <meta name="keywords" content="パソコン,ハードディスク,メモリ">
154
-
155
-
156
-
157
-
158
-
159
- ```
160
-
161
- です。
162
-
163
-
164
-
165
- やはりこれは今パンダやペンギン後では無くても良いのでしょうか。
166
-
167
-
168
-
169
- ```html
170
-
171
- <meta name="keywords" content="$keyword1,$keyword2,$keyword3">
172
-
173
- ```