質問編集履歴

1

削除

2018/11/12 12:54

投稿

HiruLow
HiruLow

スコア55

test CHANGED
File without changes
test CHANGED
@@ -1,35 +1,15 @@
1
- 目的
1
+ 削除
2
2
 
3
- 機械学習のモデルデータに適当な文字パターンを導入し学習させる事で、入力された単語がどの単語属性と類義しているか算出したい。
3
+ 削除
4
4
 
5
+ 削除
5
6
 
7
+ 削除
6
8
 
7
-
9
+ 削除
8
10
 
9
- ```ここに言語を入力
11
+ 削除
10
12
 
11
- textData=["吾輩は猫である","名前はまだない","とんねるを抜けると","そこは雪国だった","猫が走っていた"...]
13
+ 削除
12
14
 
13
- ```
15
+ 削除
14
-
15
- 上記のような適当な文章をまとめたデータを学習用データとし、猫とゆう単語が出てくる文章にだけ1のラベリングを設けます(他は0としています)
16
-
17
- ```ここに言語を入力
18
-
19
- testData=[1,0,0,0,1,...]
20
-
21
- ```
22
-
23
- これらデータをニュートラルネットワークに解析させ猫とゆう単語を指定せずに重み付けを行いたいとゆうのが今回の質問です
24
-
25
-
26
-
27
- (なぜこのようなモデルを構築するかと言いますと、他のモデルデータとマージする為、1種の候補識別用として構築をしています)
28
-
29
-
30
-
31
- 各文章を区切るにはMecabが良いと聞いたのですが、文章データを分けた状態からどうやって学習用に落とし込みするかが不明です
32
-
33
-
34
-
35
- 何かいい方法が有りましたら御回答お願い致します。