実現したいこと
Sparkフレームワークを使用して、データフレームを以下のように操作したいです。
★列「coulmn1」および「column2」でグルーピングした結果から、最大値、最小値、平均を取得する。
発生している問題
以下までは記述できたのですが、aggメソッドの使用方法がわかりません。
java
1Dataset<Row> new_ds = ds.groupBy("column1", "column2").agg( 2 /* ここに最大値、最小値、平均の処理を記述 */ 3);
試したこと
最大値にはmaxメソッド、最小値はminメソッド、平均はavgメソッドを使用するために、以下のようにimportしました。
java
1import org.apache.spark.sql.functions;
補足情報(FW/ツールのバージョンなど)
Java 11系
Spark Project Core 3.1.0
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。