teratail header banner
teratail header banner
質問するログイン新規登録

質問編集履歴

2

markdownの変更

2018/05/24 23:43

投稿

bouyomisan
bouyomisan

スコア87

title CHANGED
File without changes
body CHANGED
@@ -4,7 +4,7 @@
4
4
 
5
5
 
6
6
 
7
- '''
7
+ ```
8
8
  from sklearn.pipeline import Pipeline
9
9
  from sklearn.linear_model import LogisticRegression
10
10
  from sklearn.feature_extraction.text import TfidfVectorizer
@@ -37,4 +37,4 @@
37
37
  verbose=1,
38
38
  n_jobs=-1)
39
39
 
40
- '''
40
+ ```

1

sdfs

2018/05/24 23:43

投稿

bouyomisan
bouyomisan

スコア87

title CHANGED
File without changes
body CHANGED
@@ -1,3 +1,40 @@
1
1
  8章では機械学習の適用例として感情分析が挙げられています。8.2章ではグリッドサーチなどを使って文章を学習した時、完了するまで40分くらいかかりました。しかし8.3章でアウトオブコア 学習という手法を使うと1分くらいで学習が終了しました。
2
2
 
3
- アウトオブコアの実装内容が理解できなかったのですが、なぜこのように高速に学習を終えるのかを教えてください。
3
+ アウトオブコアの実装内容が理解できなかったのですが、なぜこのように高速に学習を終えるのかを教えてください。
4
+
5
+
6
+
7
+ '''
8
+ from sklearn.pipeline import Pipeline
9
+ from sklearn.linear_model import LogisticRegression
10
+ from sklearn.feature_extraction.text import TfidfVectorizer
11
+ from sklearn.model_selection import GridSearchCV
12
+
13
+ tfidf = TfidfVectorizer(strip_accents=None,
14
+ lowercase=False,
15
+ preprocessor=None)
16
+
17
+ param_grid = [{'vect__ngram_range': [(1, 1)],
18
+ 'vect__stop_words': [stop, None],
19
+ 'vect__tokenizer': [tokenizer, tokenizer_porter],
20
+ 'clf__penalty': ['l1', 'l2'],
21
+ 'clf__C': [1.0, 10.0, 100.0]},
22
+ {'vect__ngram_range': [(1, 1)],
23
+ 'vect__stop_words': [stop, None],
24
+ 'vect__tokenizer': [tokenizer, tokenizer_porter],
25
+ 'vect__use_idf':[False],
26
+ 'vect__norm':[None],
27
+ 'clf__penalty': ['l1', 'l2'],
28
+ 'clf__C': [1.0, 10.0, 100.0]},
29
+ ]
30
+
31
+ lr_tfidf = Pipeline([('vect', tfidf),
32
+ ('clf', LogisticRegression(random_state=0))])
33
+
34
+ gs_lr_tfidf = GridSearchCV(lr_tfidf, param_grid,
35
+ scoring='accuracy',
36
+ cv=5,
37
+ verbose=1,
38
+ n_jobs=-1)
39
+
40
+ '''