前提・実現したいこと
以下のデータフレームに対する操作を理解したいです。
該当のソースコード
python
1result = data_frame.groupBy('column1').count().groupBy('column1').agg(max(col('count')))
発生している問題
resultにどのような結果が格納されるのか理解できません。
①:data_frameを列「column1」でグルーピングする。
②:グルーピングした①のレコード数を取得する。
③:レコード数を列「column1」でグルーピングする←?
④:グルーピングした①のレコード数を列「count」に格納し、最大数を取得する。←列「count」はいつできる?
補足情報(FW/ツールのバージョンなど)
Python 3系
あなたの回答
tips
プレビュー