pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

RSS

  • 解決済

    回答
    1

    dataset.data/dataset.target とアクセスできるのはこのデータ特有なのか

    import pandas as pd from sklearn.datasets import load_boston dataset = load_boston() # set dataframe X = pd.DataFrame(dataset.data, columns=dataset.feature_names) y = pd.DataFrame

    • 0評価
    • 67PV
    hiko1129 hiko1129 5日前に ベストアンサー
  • 解決済

    回答
    1

    iloc[:, :-1] とiloc[:,[-1]]の書き方の意味がわからない

    iloc[:, :-1] とiloc[:,[-1]]の書き方の意味がわかりません。 import pandas as pd import numpy as np df = pd.read_csv('./data/data.csv', header=0) X = df.iloc[:, :-1] y = df.iloc[:,[-1]]

    • 0評価
    • 76PV
    tsuemura tsuemura 2週間前に ベストアンサー
  • 解決済

    回答
    2

    pandasでの値の編集

    MacOS Sierra 10.12.1 Pandasでの質問です。 年月 気温 水温 2017/7/1 32 23 2017/7/2 32 21 2017/7/3 31 22 2017/7/4 32 22 2017/7/5 28 20 といったようなcsvファイルがあったとき 上から3つめと4つめの水温の22を25などに値を書き換えたいときどのように実

    • 0評価
    • 60PV
    kaitokimura kaitokimura 2週間前に ベストアンサー
  • 解決済

    回答
    1

    pandasでPanelにDataFrameを追加したい

    pandasでデータ解析を行っており,Panelの扱いでつまづいたので質問させていただきます. df_dict = { 'c1': ['11', '21', '31'], 'c2': ['12', '22', '32'] } df = pandas.DataFrame(df_dict) panel = pandas.Panel() prin

    • 0評価
    • 461PV
    driller driller 2週間前に ベストアンサー
  • 解決済

    回答
    1

    pandasでの列代入

    MacOS Sierra 10.12.1 Pandasでの質問です。 年月 気温 2017/7/1 32 2017/7/2 32 2017/7/3 31 2017/7/4 32 2017/7/5 28 といったようなcsvファイルがあったとき 最終列に 水温 20 18 21 14 15 というような列を作りたい場合どのように実現すればいいのですか? あ

    • 0評価
    • 60PV
    kaitokimura kaitokimura 2週間前に コメント
  • 解決済

    回答
    1

    送られてきたJson形式のデータをcsvファイルに順次書き込む方法

    前提・実現したいこと あるpythonで書かれたプログラムを起動し、一定時間ごとのリクエストを送り、 送られてきたレスポンスのJson形式のデータをcsvファイルに順次書きこみたい。 レスポンスデータ例 {'timestamp': 1503841186, 'temp': 25.0, 'hum': 65.0} 試したこと データ分析のライブラリであるp

    • 0評価
    • 83PV
    asatake asatake 2週間前に ベストアンサー
  • 解決済

    回答
    1

    Python2系 pandasグルーピング、ソートを使用した加工処理について

    前提・実現したいこと Python2系、pandasを使用して、以下のデータ加工処理を実現したいです。 teratail、プログラミング初心者で恐縮ですが、もしご存知の方いらっしゃいましたらご教示いただけますと幸いです。 以下の2.データサンプルの<加工前>CSVファイルを、<加工後>の状態(CSVファイルや、リスト、DataFrameの状態)にしたいで

    • 0評価
    • 49PV
    kapi0920 kapi0920 2週間前に ベストアンサー
  • 解決済

    回答
    3

    Pythonのディレクトリ探索と該当するファイルのデータ保存について

    Python初心者です。 Pythonで以下仕様のプログラムを作成したいのですが、 ご教示いただけないでしょうか? よろしくお願いいたします。 仕様: ルートディレクトリの直下には複数のサブディレクトリが置かれており、 それぞれのサブディレクトリには任意の名前がつけられています (それぞれサブディレクトリの名前に規則性はありません)。 それぞれのサブ

    • 0評価
    • 52PV
    yuu817 yuu817 2週間前に コメント
  • 受付中

    回答
    1

    RandomForestClassifier にデータを学習させられない

    RandomForestClassifier にデータを学習させられないです。 http://qiita.com/suzumi/items/8ce18bc90c942663d1e6 を見ながら Kaggleのタイタニックチャレンジを再現しています。 ランダムフォレストに入れて学習させるところで、 forest = RandomForestClassifi

    • 0評価
    • 71PV
    pigooosuke pigooosuke 3週間前に 回答
  • 解決済

    回答
    1

    コードの内容がよくわからない

    コードの内容がよくわからないです。 http://qiita.com/suzumi/items/8ce18bc90c942663d1e6 を見ながら Kaggleのタイタニックチャレンジを再現しています。 しかし、 欠損値の扱い のところの split_data = [] for survived in [0,1]: split_data.app

    • 0評価
    • 88PV
    okateim okateim 3週間前に ベストアンサー
  • 解決済

    回答
    1

    , ごとにカラムを分けたい

    , ごとにカラムを分けたいです。 今、Kaggleのタイタニックチャレンジのデータを読み込ませています。 ですが、表のようにコンマごとに区切られず全部一緒のカラムに入ってしまいます。 本来はこのように分けたいのですが... csvファイルのコンマごとにカラムを分けるメソッドややり方があったと思うのですが思い出せず.. どのようにかけば目的のことができ

    • 0評価
    • 76PV
    rrrrrrrr rrrrrrrr 3週間前に ベストアンサー
  • 解決済

    回答
    1

    グリッドサーチのIndexErrorエラー

    pythonのランダムフォレストでグリッドサーチをかけたいのですがエラーが出てしまいます。 parameters = { 'n_estimators' : [5, 10, 30, 50, 100, 500], 'max_features' : [3, 5, 10], 'random_state' :

    • 0評価
    • 64PV
    syakwti syakwti 3週間前に ベストアンサー
  • 解決済

    回答
    1

    TensorFlowを使用中にSyntaxError、新バージョンが反映されない。

    TensorFlowを使用中にSyntaxErrorが出ました。 Using TensorFlow backend. Traceback (most recent call last): File "keras01.py", line 4, in <module> from keras.datasets import cifar10 File "/hom

    • 0評価
    • 53PV
    miyamoto0105 miyamoto0105 4週間前に ベストアンサー
  • 解決済

    回答
    1

    python pandas 累計和(符号違いで0にリセット)

    前提・実現したいこと pythonでpandasを使用しています。 -1, 0, 1 しかないnumというcolumnがあり、 numの符号が一致している限り、累積和を計算し、 符号が異なる場合、0にリセットして、 新しい列resultに格納したいと考えています。 発生している問題・エラーメッセージ エラーは出ませんが、期待する出力結果になりません。

    • 0評価
    • 57PV
    draftnyan draftnyan 4週間前に コメント
  • 解決済

    回答
    1

    pandasでの最大値集計の方法

    前提・実現したいこと 現在pandasを少し勉強しています. その中で,行ごとの最大値を出力したいと考えています. 該当のソースコード 例えば,下記のソースの場合ですと,一行目の最大値はC列,二行目の最大値はC列...といった具合に集計したいです. import numpy as np import pandas as pd df = pd.Data

    • 0評価
    • 65PV
    papi_tokei papi_tokei 4週間前に ベストアンサー
  • 解決済

    回答
    2

    pandas 出力を揃える

    前提・実現したいこと ここに質問したいことを詳細に書いてください (例)PHP(CakePHP)で●●なシステムを作っています。 ■■な機能を実装中に以下のエラーメッセージが発生しました。 ローマ字のように漢字でもカラムと要素を末尾に揃えたい 発生している問題・エラーメッセージ エラーメッセージ 該当のソースコード ここに言語を入力 ここにご自身が実行し

    • 0評価
    • 59PV
    kazu_2017 kazu_2017 1ヶ月前に コメント
  • 解決済

    回答
    1

    pandasでの要素の変更について

    前提・実現したいこと pandasを使用して、データ処理を行なっています。 そこでデータフレーム内の要素が"AA"のものだけを"A"にしたいと考えています。 index 検査項目 数値 田中 AA 2.2 田中 B 1.3 田中 C 80 吉田 AA 2.5 吉田

    • 0評価
    • 46PV
    YoheiYamasaki YoheiYamasaki 1ヶ月前に コメント
  • 解決済

    回答
    1

    CSVからインポートする数字を文字列として読み込みたい

    CSVから11桁の通し番号を読み込むと3.613302e+10のように表示され、 そのまま再度csvに出力すると、この番号に11111111111.0のように後ろに.0が追加されます。 識別番号なので非常に困っております。 なお、dataframeはpandasで読み込んでいます。 どうすればよいか困っております。 よろしくお願いいたします。

    • 0評価
    • 69PV
    midsum0323 midsum0323 1ヶ月前に コメント
  • 解決済

    回答
    1

    python dataframeの結合方法について

    pythonのdataframeの結合方法について質問があります。 2つのdataframeがあり、片方の行をもう片方に挿入することがしたいです。 1行だけ挿入することは、出来たのですが複数行を一括で挿入することができません。 どこを修正すれば、理想的に動くでしょうか? input index A B C 0 for one 11

    • 0評価
    • 89PV
    wayaya wayaya 1ヶ月前に ベストアンサー
  • 解決済

    回答
    2

    Dataframeでのif文について

    前提・実現したいこと pythonのpandasでdataframeを作り、表の中で条件に当てはまる行にフラグを立てたいと思っています for文とif文でかんたんに実現できるかなと思ったのですが、思ったように数字が入りません イメージとしては以下になります。 index AAA FLAG 1 1 2 2 3 8 4 8 5 8 6

    • 0評価
    • 102PV
    bowkite bowkite 1ヶ月前に 回答
1

タグ情報

  • あなたの順位

    -

  • タグ登録者数

    56

  • 総質問数

    147

  • 今週の質問数

    0

関連するタグ

思考するエンジニアのためのQ&Aサイト「teratail」について詳しく知る