質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

Q&A

解決済

1回答

776閲覧

pandasでcsvを読み込む際のカラムに関するエラー

yasutin

総合スコア41

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

0グッド

0クリップ

投稿2022/12/12 01:11

前提

ある商品のレビューのテキスト入っているcsvファイルを読み込んでグラフを表示させたい。
その読み込む際にエラーが生じた。

発生している問題・エラーメッセージ

pandas.errors.ParserError: Error tokenizing data. C error: Expected 1 fields in line 4, saw 2

該当のソースコード

python

1# coding: utf-8 2import csv 3import pandas as pd 4import MeCab 5import collections 6import seaborn as sns 7import matplotlib.pyplot as plt 8import japanize_matplotlib 9 10files = open(r"C:\Users\Yasu\Documents\情報科学特別演習\csv\折れ線ぐらふにしたい\review_text.xlsx",encoding="utf-8",errors="ignore") 11 12data = pd.read_csv(files) 13message = data["text"] 14messagelst = message.astype(str).tolist() 15messagestr = "".join(messagelst) 16 17 18mecab = MeCab.Tagger("-Ochasen") 19 20node = mecab.parseToNode(messagestr) 21words=[] 22while node: 23 hinshi = node.feature.split(",")[0] 24 if hinshi in ["名詞","動詞","形容詞"]: 25 origin = node.feature.split(",")[6] 26 if origin == "*": 27 words.append(node.surface) 28 else: 29 words.append(origin) 30 node = node.next 31 32c = collections.Counter(words) 33sns.set(context="talk",font="IPAexGothic") 34fig, ax = plt.subplots(figsize=(8,8)) 35sns.countplot(y=words,order=[i[0] for i in c.most_common(20)]) 36 37plt.show() 38 39

試したこと

読み込みたいCSVファイルの4行目に何か問題があるようだったので確認したが、何がおかしいのかわからなかった。
読み込みたいCSVファイル

補足情報(FW/ツールのバージョンなど)

python3.10.2
IDLE
windows11

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

quickquip

2022/12/12 01:20 編集

Expected 1 fields in line 4, saw 2 と書いてあるとおりだと思うのでテキストエディタ等でファイルを見ましょう。
melian

2022/12/12 01:22

Excel ファイルを読み込む場合は read_excel() を使います。 data = pd.read_excel("C:\Users\Yasu\Documents\情報科学特別演習\csv\折れ線ぐらふにしたい\review_text.xlsx")
yasutin

2022/12/12 08:49

エクセルファイルをCSVファイルに変換するのを忘れていました!!!!ありがとうございます!解決しました。
yasutin

2022/12/12 08:56 編集

melianさんをベストアンサーにしたいので、回答していただけますか?
yasutin

2022/12/12 08:50

quickquipさんもありがとうございました!
melian

2022/12/12 08:59

ありがとうございます、回答に書きました。
guest

回答1

0

ベストアンサー

※ コメントから転記

Excel ファイルを読み込む場合は read_excel() を使います。

python

1data = pd.read_excel("C:\Users\Yasu\Documents\情報科学特別演習\csv\折れ線ぐらふにしたい\review_text.xlsx")

投稿2022/12/12 08:59

melian

総合スコア19618

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問