Spark

rss_feed

Spark(Apache Spark)とは、膨大なデータを迅速、柔軟に分散並行処理を行うフレームワークです。分析ツールであるApache Hadoopと比較し、最大で100倍の速度でデータ処理ができるとされています。

  • 新着

  • アクティブ

  • 未回答

  • 未解決

  • 注目

  • 解決済

  • 解決済

    回答
    1

    firebase。プロジェクト数の上限について。

    • -1評価
    • 0クリップ
    • 162PV
    popobot popobot 1ヶ月前 ベストアンサー
  • 解決済

    回答
    2

    カテゴリごとにRow数を調整(削除)する

    • 0評価
    • 1クリップ
    • 151PV
    bsdfan bsdfan 2ヶ月前 ベストアンサー
  • 受付中

    回答
    2

    SQLでの1対n結合

    • 0評価
    • 0クリップ
    • 134PV
    neko_the_shadow neko_the_shadow 3ヶ月前 回答
  • 解決済

    回答
    1

    Pretty printerによる文字列の格子状表示

    • 0評価
    • 0クリップ
    • 148PV
    ppaul ppaul 3ヶ月前 ベストアンサー
  • 受付中

    回答
    1

    pyspark sdfの値埋め

    • 0評価
    • 0クリップ
    • 217PV
    ppaul ppaul 3ヶ月前 回答
  • 解決済

    回答
    3

    pysparkでdatime日時とstring日時の差分

    • 0評価
    • 0クリップ
    • 314PV
    sasakin sasakin 3ヶ月前 回答
  • 解決済

    回答
    1

    groupbyによる組み合わせカラム作成

    • 0評価
    • 0クリップ
    • 255PV
    ppaul ppaul 3ヶ月前 ベストアンサー
  • 受付中

    回答
    0

    Py4JJavaErrorの原因がわからないです

    • 0評価
    • 0クリップ
    • 269PV
    teratailが 5ヶ月前 アップデート
  • 解決済

    回答
    1

    Sparkのaggメソッドの使い方を理解したい

    • 0評価
    • 0クリップ
    • 193PV
    Fur0 Fur0 5ヶ月前 ベストアンサー
  • 解決済

    回答
    2

    DBのInterval型カラムをBigQueryに連携して集計したい

    • 0評価
    • 0クリップ
    • 357PV
    yu_1985 yu_1985 11ヶ月前 コメント
  • 受付中

    回答
    2

    毎回ポート開放をターミナルで行っています。他の方法があると思うのですが、、

    • 0評価
    • 0クリップ
    • 392PV
    dodox86 dodox86 11ヶ月前 コメント
  • 受付中

    回答
    0

    Sparkフレームワークでプログラムの内容を変更しても更新されない

    • 0評価
    • 0クリップ
    • 389PV
    teratailが 12ヶ月前 アップデート
  • 受付中

    回答
    0

    Dockerでapatch spark 3.0.0 を使えるようにしたい(フリーズではなくエラーコード137が返却されました)

    • 0評価
    • 0クリップ
    • 469PV
    teratailが 1年前 アップデート
  • 解決済

    回答
    1

    pysparkのdataframeでjoinしてshowを実行しようとするとエラーが出る

    • 0評価
    • 0クリップ
    • 782PV
    yuki0716 yuki0716 1年前 回答
  • 解決済

    回答
    1

    Spark-SQLの「外部クエリを参照する式…」エラーを修正する方法

    • 0評価
    • 0クリップ
    • 461PV
    piyopiyo_pi piyopiyo_pi 1年前 コメント
  • 受付中

    回答
    0

    databricks上でのSQL実行について

    • 0評価
    • 1クリップ
    • 623PV
    teratailが 1年前 アップデート
  • 受付中

    回答
    1

    並列処理の分散処理度合いについて

    • 0評価
    • 0クリップ
    • 579PV
    otolab otolab 2年前 回答
  • 受付中

    回答
    1

    pysparkでscvを読み込むとNULLになってしまいます

    • 0評価
    • 0クリップ
    • 1006PV
    bamboo-nova bamboo-nova 2年前 回答
  • 解決済

    回答
    1

    pythonでファイルを開いて画像を表示したい

    • 0評価
    • 1クリップ
    • 1096PV
    tiitoi tiitoi 2年前 回答を編集
  • 解決済

    回答
    1

    ApacheSparkをマックにインストールできません。

    • 0評価
    • 0クリップ
    • 870PV
    Kazuhiro0104 Kazuhiro0104 2年前 ベストアンサー

思考するエンジニアのためのQ&Aサイト「teratail」について詳しく知る