質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

Q&A

解決済

1回答

1049閲覧

AnacondaのSpyderでCSVを読み込み要素の出現回数を取り出したい

退会済みユーザー

退会済みユーザー

総合スコア0

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

0グッド

1クリップ

投稿2018/04/17 23:53

編集2018/04/18 23:30

結論(問題ありませんでした)

SpyderのIPythonコンソールのバッファーの行数が少なかったため表示されていないだけでした。
イメージ説明
ご回答・ご質問をいただいた皆様、無駄なお時間を使わせてしまい、申し訳ございませんでしたm(__)m

前提・実現したいこと

CSVを読み込み要素の出現回数を取り出したいです。

得たい結果

りんご 5 みかん 3 バナナ 2 ・・・(続く)

コード

python

1import pandas as pd 2 3df = pd.read_csv(r'C:\Users\user\Desktop\item_list.csv', encoding="shift_jis") 4 5# 件数は出てくるが、一部欠けている 6# vc = df['item_name'].value_counts() 7# print(vc) 8 9# すべて1件 10for index, value in df['item_name'].value_counts().iteritems(): 11 print(index, ': ', value)

pythonコード中の『件数は出てくるが、一部欠けている』について

下記csvのぶどう、いちごが表示されません。

csv

1item_name 2ぶどう 3ぶどう 4ぶどう 5りんご 6バナナ 7りんご 8みかん 9みかん 10いちご 11いちご 12いちご 13バナナ 14・・・(以下続く)

結果

りんご 4000 みかん 3000 バナナ 2800 # ぶどう、いちごが表示されない

困っている事

少ないデータだと動いてるっぽいのですが、44000件のデータだとうまく動きません。
下記の通りになります。

りんご 1 みかん 1 バナナ 1 メロン 1 ・・・(以下同じ)

コピペしたサイト

note.nkmk.me pandasでユニークな要素の個数、頻度(出現回数)をカウント

補足情報(FW/ツールのバージョンなど)

AnacondaのSpyderで作業しています。
CSVはWindowsのExcel2013で作成しています。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

fuzzball

2018/04/18 00:14

「ユニークな要素の出現回数」って1回じゃないんですか?
退会済みユーザー

退会済みユーザー

2018/04/18 00:35

た、確かにおっしゃる通りですね。。修正します。
magichan

2018/04/18 01:06

質問のコードに記述されております df['item_name'].value_counts() で全く問題ないように思います。データ自体が壊れていることはありませんか?「件数は出てくるが、一部欠けている」はどのように欠けているのでしょうか?
退会済みユーザー

退会済みユーザー

2018/04/18 02:44

ご質問ありがとうございます。pythonコード中の『件数は出てくるが、一部欠けている』についてに追記しました。
KojiDoi

2018/04/18 04:50

44000件のデータを作って質問文のコードを実行してみましたが、問題なく実行できました(ただしこちらの環境の都合でデータはUTF-8にしています)。やはり問題はお使いになったデータの方にあるのではないかという気がします。
退会済みユーザー

退会済みユーザー

2018/04/18 05:13

ご回答ありがとうございます。Windows環境でExcel2013で作成したCSVを使用しています。後日、UTF-8で試してみます。
guest

回答1

0

ベストアンサー

numpyのunique()を作ったらいかがでしょうか?
オプションにreturn_counts=Trueを設定するとユニーク化された要素別の数が得られます。

python

1import numpy 2elem,cnt=numpy.unique(df,return_counts=True) 3result=pd.DataFrame([ele,cnt])

投稿2018/04/18 00:59

R.Shigemori

総合スコア3376

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

退会済みユーザー

退会済みユーザー

2018/04/18 02:40

ご回答ありがとうございます。後日試してみます。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問