質問編集履歴

markdownの変更

2018/05/24 23:43

投稿

bouyomisan

スコア87

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -4,7 +4,7 @@
-'''
+```
 from sklearn.pipeline import Pipeline
 from sklearn.linear_model import LogisticRegression
 from sklearn.feature_extraction.text import TfidfVectorizer
@@ -37,4 +37,4 @@
                            verbose=1,
                            n_jobs=-1)
-'''
+```

sdfs

2018/05/24 23:43

投稿

bouyomisan

スコア87

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -1,3 +1,40 @@
 8章では機械学習の適用例として感情分析が挙げられています。8.2章ではグリッドサーチなどを使って文章を学習した時、完了するまで40分くらいかかりました。しかし8.3章でアウトオブコア 学習という手法を使うと1分くらいで学習が終了しました。
-アウトオブコアの実装内容が理解できなかったのですが、なぜこのように高速に学習を終えるのかを教えてください。
+アウトオブコアの実装内容が理解できなかったのですが、なぜこのように高速に学習を終えるのかを教えてください。
+'''
+from sklearn.pipeline import Pipeline
+from sklearn.linear_model import LogisticRegression
+from sklearn.feature_extraction.text import TfidfVectorizer
+from sklearn.model_selection import GridSearchCV
+tfidf = TfidfVectorizer(strip_accents=None,
+                        lowercase=False,
+                        preprocessor=None)
+param_grid = [{'vect__ngram_range': [(1, 1)],
+               'vect__stop_words': [stop, None],
+               'vect__tokenizer': [tokenizer, tokenizer_porter],
+               'clf__penalty': ['l1', 'l2'],
+               'clf__C': [1.0, 10.0, 100.0]},
+              {'vect__ngram_range': [(1, 1)],
+               'vect__stop_words': [stop, None],
+               'vect__tokenizer': [tokenizer, tokenizer_porter],
+               'vect__use_idf':[False],
+               'vect__norm':[None],
+               'clf__penalty': ['l1', 'l2'],
+               'clf__C': [1.0, 10.0, 100.0]},
+              ]
+lr_tfidf = Pipeline([('vect', tfidf),
+                     ('clf', LogisticRegression(random_state=0))])
+gs_lr_tfidf = GridSearchCV(lr_tfidf, param_grid,
+                           scoring='accuracy',
+                           cv=5,
+                           verbose=1,
+                           n_jobs=-1)
+'''