質問編集履歴
1
適当でない内容に対しての変更を行いました。
test
CHANGED
@@ -1 +1 @@
|
|
1
|
-
|
1
|
+
sedの正規表現について。
|
test
CHANGED
@@ -1,173 +1,31 @@
|
|
1
|
+
linuxのbashにてsedでhtmlタグ内の文字列を正規表現で指定したいのですが
|
2
|
+
|
1
|
-
|
3
|
+
その記述がいまいちよくわからないので教えてください。
|
2
4
|
|
3
5
|
|
4
6
|
|
5
|
-
|
7
|
+
下記は<tag1>内にある任意の文字列を抽出して改行し
|
6
8
|
|
7
|
-
新規domainなのでアクセスがあまり来ないです。
|
8
|
-
|
9
|
-
最低限のページャはつけました。
|
10
|
-
|
11
|
-
|
12
|
-
|
13
|
-
googlewebmastertoolを設定して
|
14
|
-
|
15
|
-
アナリティクスもつけました。
|
16
|
-
|
17
|
-
|
18
|
-
|
19
|
-
取ったばかりの新規ドメインはコンテンツ完成・公開から一ヶ月未満です。
|
20
|
-
|
21
|
-
|
22
|
-
|
23
|
-
```html
|
24
|
-
|
25
|
-
<meta name="keywords" content="HTML,CSS,XML,JavaScript">
|
26
|
-
|
27
|
-
```
|
28
|
-
|
29
|
-
このkeywordは空白にしました。
|
30
|
-
|
31
|
-
なぜかというと全てのページで同じkeywordを設定してしまうと
|
32
|
-
|
33
|
-
スパムになると考えたからです。
|
34
|
-
|
35
|
-
|
36
|
-
|
37
|
-
それでも設定しないよりは設定したほうがいいかもしれないということで
|
38
|
-
|
39
|
-
設定するとなるとスパムにならない・かぶらないキーワードを各ページに
|
40
|
-
|
41
|
-
割り当てる必要が出てきました。
|
42
|
-
|
43
|
-
|
44
|
-
|
45
|
-
そこ
|
9
|
+
そこに<tag2>を設置してその中に任意の文字列を置換しています。
|
46
|
-
|
47
|
-
|
48
|
-
|
49
|
-
環境は
|
50
|
-
|
51
|
-
|
52
|
-
|
53
|
-
centos6.7
|
54
|
-
|
55
|
-
php5.6
|
56
|
-
|
57
|
-
端末 bash
|
58
|
-
|
59
|
-
html
|
60
10
|
|
61
11
|
|
62
12
|
|
63
13
|
|
64
14
|
|
65
|
-
|
15
|
+
```bash
|
66
16
|
|
67
|
-
|
68
|
-
|
69
|
-
```html
|
70
|
-
|
71
|
-
<
|
17
|
+
sed 's|<tag1>.*</tag1>|<tag1>.*</tag1>\n<tag2>.*</tag2>|g'
|
72
18
|
|
73
19
|
```
|
74
20
|
|
75
21
|
|
76
22
|
|
77
|
-
|
23
|
+
ここで使われている.*は使用できませんでした。
|
78
|
-
|
79
|
-
それを$keywordに代入したい(書き換えたい)と思っています。
|
80
24
|
|
81
25
|
|
82
26
|
|
83
|
-
|
27
|
+
それともう一つ知りたいことがあるのですが
|
84
28
|
|
29
|
+
任意の文字列のn番目のヒットを対象とする表現もできますでしょうか
|
85
30
|
|
86
|
-
|
87
|
-
googleではこの<meta name="keywords"をクローラーは無視している
|
88
|
-
|
89
|
-
らしいのですが、もしこの設定が有効なおであればそうしたいと思っています。
|
90
|
-
|
91
|
-
おおよそどのくらいでindexがくる感じなのでしょうか。
|
92
|
-
|
93
|
-
|
31
|
+
よろしくご教授お願い致します。
|
94
|
-
|
95
|
-
|
96
|
-
|
97
|
-
まだ新規ドメイン取得後一ヶ月未満なので
|
98
|
-
|
99
|
-
例えば100ページあったとしたなら20ページくらいしかインデックスされていません。
|
100
|
-
|
101
|
-
|
102
|
-
|
103
|
-
|
104
|
-
|
105
|
-
やったこと:
|
106
|
-
|
107
|
-
|
108
|
-
|
109
|
-
サーバー構築
|
110
|
-
|
111
|
-
独自ドメイン取得・反映
|
112
|
-
|
113
|
-
googlewebmastertool 所有権の確認
|
114
|
-
|
115
|
-
googleアナリティクスの設置
|
116
|
-
|
117
|
-
コンテンツの作成
|
118
|
-
|
119
|
-
アップロード
|
120
|
-
|
121
|
-
|
122
|
-
|
123
|
-
|
124
|
-
|
125
|
-
これからやろうとしていること:
|
126
|
-
|
127
|
-
|
128
|
-
|
129
|
-
```html
|
130
|
-
|
131
|
-
<title>$title</title>
|
132
|
-
|
133
|
-
<meta name="keywords" content="$keyword1,$keyword2,$keyword3">
|
134
|
-
|
135
|
-
```
|
136
|
-
|
137
|
-
これら(ローカルファイル)すべてにプログラムで重複しないように取得し置換する。
|
138
|
-
|
139
|
-
|
140
|
-
|
141
|
-
(そのページからキーワードを拾って代入する)(日本語)です。)
|
142
|
-
|
143
|
-
|
144
|
-
|
145
|
-
|
146
|
-
|
147
|
-
例
|
148
|
-
|
149
|
-
```html
|
150
|
-
|
151
|
-
<title>$パソコン</title>
|
152
|
-
|
153
|
-
<meta name="keywords" content="パソコン,ハードディスク,メモリ">
|
154
|
-
|
155
|
-
|
156
|
-
|
157
|
-
|
158
|
-
|
159
|
-
```
|
160
|
-
|
161
|
-
です。
|
162
|
-
|
163
|
-
|
164
|
-
|
165
|
-
やはりこれは今パンダやペンギン後では無くても良いのでしょうか。
|
166
|
-
|
167
|
-
|
168
|
-
|
169
|
-
```html
|
170
|
-
|
171
|
-
<meta name="keywords" content="$keyword1,$keyword2,$keyword3">
|
172
|
-
|
173
|
-
```
|