質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

1522閲覧

pythonの言語判定においてコードにエラーが生じた理由がわからない

python53241545

総合スコア13

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2018/12/05 18:35

誤作動を起こしている原因を知りたい

発生している問題・エラーメッセージ

line 27 y_train=['ja','en','th'] #学習用の答え unvalid character in identifie

該当のソースコード

python

1import numpy as np 2from sklearn.naive_bayes import GaussianNB #アルゴリズム 3from sklearn.metrics import accuracy_score 4 5#Unicodeのコードポイント頻度測定 6def count_codePoint(str): 7 #Unicodeのコードポイントをアドレスとする配列を用意 8 counter=np.zeros(65535) 9 10 for i in range(len(str)): 11 #各文字をUnidodeのコードポイントに変換 12 code_point=ord(str[i]) #一つずつ変換して処理する 13 if code_point>65535: 14 continue 15 #対応するアドレスの出現回数に1を足す 16 counter[code_point]+=1 17 #各要素を文字数で割って正規化 18 counter=counter/len(str) #? 19 return counter 20 21#学習用データの準備 22ja_str='これは日本語の文章です' 23en_str='This is English Sentences.' 24th_str='นี่เป็นประโยคภาษาญี่ปุ่น' 25 26x_train=[count_codePoint(ja_str),count_codePoint(en_str),count_codePoint(th_str)] #学習する教科書、参考書の問題 27y_train=['ja','en','th'] #学習用の答え 28 29#学習する 30clf=GausssianNB() #アルゴリズム生成 31clf.fit(x_train,y_train) 32 33#評価用のデータ 34ja_test_str='こんにちは' 35en_test_str='Hello' 36th_test_str='สวัสดี' 37 38x_test=[count_codePoint(ja_test_str),count_codePoint(en_test_str),count_codePoint(th_test_str)] #テスト用の問題 39y_test=['ja','en','th'] #テスト用の答え 40 41#評価する 42y_pred=clf.predict(x_test) #テスト用の問題から答えを予測する 43print(y_pred) 44print('正解率=',accuracy_score(y_test,y_pred)) #関数を使って(テスト用の答え,テスト用の答えの予想)という形で正解率を予測する 45

試したこと

何回か打ち直したが間違えているところが分からなかった

補足情報

python初心者で簡易な質問かもしれませんが回答よろしくお願いします!

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

エラーメッセージは正確にコピペしてください。


処理系が^でエラーの箇所を示してくれていると思います(実行方法にもよりますが)。

python

1>>> y_train=['ja','en','th'] #学習用の答え 2 File "<stdin>", line 1 3 y_train=['ja','en','th'] #学習用の答え 4 ^ 5SyntaxError: invalid character in identifier 6

ここにカーソルを当てると、全角スペースであることがわかります。半角スペースに置き換えればこのエラーは解消します。

投稿2018/12/05 19:29

hayataka2049

総合スコア30933

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問