質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
NumPy

NumPyはPythonのプログラミング言語の科学的と数学的なコンピューティングに関する拡張モジュールです。

保存

保存(save)とは、特定のファイルを、ハードディスク等の外部記憶装置に記録する行為を指します。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

データマイニング

データマイニングは、購買履歴やクレジットカードの利用履歴、電話の通話履歴など企業にある大量のデータを解析して、その中に隠れたパターンやルールを探し出す技術です。DMと略されることもあります。

自然言語処理

自然言語処理は、日常的に使用される自然言語をコンピューターに処理させる技術やソフトウェアの総称です。

Q&A

0回答

1041閲覧

sklearnのCountVectorizerのベクトルを保存後にロードする方法

y.isshi

総合スコア7

NumPy

NumPyはPythonのプログラミング言語の科学的と数学的なコンピューティングに関する拡張モジュールです。

保存

保存(save)とは、特定のファイルを、ハードディスク等の外部記憶装置に記録する行為を指します。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

データマイニング

データマイニングは、購買履歴やクレジットカードの利用履歴、電話の通話履歴など企業にある大量のデータを解析して、その中に隠れたパターンやルールを探し出す技術です。DMと略されることもあります。

自然言語処理

自然言語処理は、日常的に使用される自然言語をコンピューターに処理させる技術やソフトウェアの総称です。

0グッド

0クリップ

投稿2020/04/16 07:56

fit_transform()後のベクトルを、numpy.saveで保存。
下記のソースコードで新しい対象のデータをtransform()するために、ベクトルをnumpy.loadして
います。
その後に、新しいデータをtransform()したいのですが、AttributeError: transform not foundのエラーが立ちます。
bag = vect.transform(text1)のコードが悪いのでしょうか?
ベクトル化したデータをどう使ってtransformして良いのか不明で・・・
ご教授いただけないでしょうか?

python

1import csv 2import numpy as np 3import MeCab 4import numpy 5import scipy.sparse.csr 6from sklearn.feature_extraction.text import CountVectorizer 7 8 9# MeCab による単語への分割関数 (名詞のみ残す) 10def split_text_only_noun(text): 11 tagger = MeCab.Tagger() 12 13 words = [] 14 for c in tagger.parse(text).splitlines()[:-1]: 15 surface, feature = c.split('\t') 16 pos = feature.split(',')[0] 17 if pos == '名詞': 18 words.append(surface) 19 # if pos == '動詞': 20 # words.append(surface) 21 return ' '.join(words) 22 23#bags = count.fit_transform(docs1)したデータをnumpy.save('my_vector',bags.toarray())で保存 24#上記データをロード 25vect = scipy.sparse.csr.csr_matrix(numpy.load('my_vector.npy')) 26 27# 予測用テキスト読み込み 28text1 = [] 29with open('clubthai.csv') as f: 30 reader = csv.reader(f) 31 print(reader) 32 for row in reader: 33 text = np.array(row) 34 print(text) 35 36 for textx in text: 37 # 分かち書きして配列に保存 38 tx = split_text_only_noun(textx) 39 text1.append(tx) 40print(text1) 41 42bag = vect.transform(text1) 43 44print(bag.toarray()) 45 46# 予測用テキストbow保存 47with open("create_text2.csv", "a", newline='', encoding="utf-8") as wf: 48 writer = csv.writer(wf, lineterminator="\n") 49 writer.writerows(bag.toarray()) 50

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだ回答がついていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問