編集履歴

質問編集履歴

意図的な内容抹消の取り消し

2018/10/10 02:06

投稿

rrrrrrrry

スコア20

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -1,9 +1,131 @@
 ### 前提・実現したいこと
 [実現したいこと]作成したngramのプログラムについて出現回数の実装
+ngramした後の出現回数がどのようになっているのか確認できるようなプログラムをどう書けばいいのかご教授いただきたいです。このソースは広いもので、文字コードの変換とpython2のコードをpython3に変換しました。
+### 該当のソースコード
+```python
+#!/usr/bin/env python
+# -*- coding: utf-8 -*-
+import sys
+import subprocess as cmd
+# テキスト -> 単語(形態素)集合
+def text2bow(obj,mod):
+   # input: ファイルの場合はmod="file", input: 文字列の場合はmod="str"
+   if mod == "file":
+       morp = cmd.getstatusoutput("cat " + obj + " | mecab -Owakati")
+   elif mod == "str":
-ngramした後の出現回数がどのようになっているのか確認できるようなプログラムをどう書けばいいのかご教授いただきたいです。このソースは広いもので、文字コードの変換とpython2のコードをpython3に変換しました。
+       morp = cmd.getstatusoutput("echo " + obj.encode('utf-8') + " | mecab -Owakati")
+   else:
+       print("error!!")
+       sys.exit(0)
+   words = morp[1]
+   words = words.replace('\n','')
+   bow = words.split(' ')
+   return bow
+# N-gramの生成
+def gen_Ngram(words,N):
+   ngram = []
+   for i in range(len(words)):
+       cw = ""
+       if i >= N-1:
+           for j in reversed(list(range(N))):
+               cw += words[i-j]
+       else:
+           continue
+       ngram.append(cw)
+   return ngram
+# 出力
+def output_Ngram(ngram):
+   for i in range(len(ngram)):
+       print(ngram[i])
+def main():
+   argvs = sys.argv
+   # input: ファイルの場合
+   bow = text2bow(argvs[2],mod="file")
+   # input: 文字列の場合
+   #bow = text2bow(obj=u"これはN-gramを生成するプログラムです．",mod="str")
+   ngram = gen_Ngram(bow,int(argvs[1]))
+   output_Ngram(ngram)
+if __name__ == "__main__":
+   main()
+```
+### 参考文献
+https://qiita.com/takumi_TKHS/items/942492b72aaf7b6a6213

修正

2018/10/10 02:06

投稿

退会済みユーザー

スコア0

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -7,155 +7,3 @@
 ngramした後の出現回数がどのようになっているのか確認できるようなプログラムをどう書けばいいのかご教授いただきたいです。このソースは広いもので、文字コードの変換とpython2のコードをpython3に変換しました。
-### 該当のソースコード
-```python
-#!/usr/bin/env python
-# -*- coding: utf-8 -*-
-import sys
-import subprocess as cmd
-# テキスト -> 単語(形態素)集合
-def text2bow(obj,mod):
-    # input: ファイルの場合はmod="file", input: 文字列の場合はmod="str"
-    if mod == "file":
-        morp = cmd.getstatusoutput("cat " + obj + " | mecab -Owakati")
-    elif mod == "str":
-        morp = cmd.getstatusoutput("echo " + obj.encode('utf-8') + " | mecab -Owakati")
-    else:
-        print("error!!")
-        sys.exit(0)
-    words = morp[1]
-    words = words.replace('\n','')
-    bow = words.split(' ')
-    return bow
-# N-gramの生成
-def gen_Ngram(words,N):
-    ngram = []
-    for i in range(len(words)):
-        cw = ""
-        if i >= N-1:
-            for j in reversed(list(range(N))):
-                cw += words[i-j]
-        else:
-            continue
-        ngram.append(cw)
-    return ngram
-# 出力
-def output_Ngram(ngram):
-    for i in range(len(ngram)):
-        print(ngram[i])
-def main():
-    argvs = sys.argv
-    # input: ファイルの場合
-    bow = text2bow(argvs[2],mod="file")
-    # input: 文字列の場合
-    #bow = text2bow(obj=u"これはN-gramを生成するプログラムです．",mod="str")
-    ngram = gen_Ngram(bow,int(argvs[1]))
-    output_Ngram(ngram)
-if __name__ == "__main__":
-    main()
-```
-### 参考文献
-https://qiita.com/takumi_TKHS/items/942492b72aaf7b6a6213