「Pythonによるデータ分析入門」について、書籍を読まれている方、またデータ分析について詳しい方にお伺いします。
p.25の中に
lang
1indexer = agg_counts.sum(1).argsort()
という箇所がありますが、sum(1)がいったい何を示しているのか分からず困っております。
どなたかご教授いただければ幸いです。
よろしくお願いいたします。
以下、データを表示するために必要なスクリプトです。
データは以下のURLからダウンロード・解凍してもらえれば大丈夫です。
https://github.com/pydata/pydata-book/archive/master.zip
lang
1#!/usr/bin/env python 2 3import json 4import numpy as np; import pandas as pd 5from pandas import DataFrame, Series 6 7# Data Path 8path = 'ch02/usagov_bitly_data2012-03-16-1331923249.txt' 9 10# Read & Abstruct Data 11records = [json.loads(line) for line in open(path)] 12 13# Using DataFrame 14frame = DataFrame(records) 15cframe = frame[frame.a.notnull()] 16operating_system = np.where(cframe['a'].str.contains('Windows'), 'Windows', 'Not Windows') 17by_tz_os = cframe.groupby(['tz',operating_system]) 18agg_counts = by_tz_os.size().unstack().fillna(0) 19 20indexer = agg_counts.sum(1).argsort() 21print indexer[:10] 22
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2016/03/26 14:52