pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

RSS

  • 解決済

    回答
    2

    pandasのデータフレームの特定の列の値の更新

    前提・実現したいこと pandasでデータフレームを作成したのち、特定の列の値を指定した条件で修正したいです。 例えば、以下のようなソースコードを実行します。 >>>matrix = np.random.randn(6,4) >>>df2 = pd.DataFrame(matrix, columns=list('ABCD')) >>>df2

    • 0評価
    • 49PV
    papi_tokei papi_tokei 1日前に ベストアンサー
  • 受付中

    回答
    1

    機械学習scikit-learnのfitを使った複数回学習

    scikit-learnのfitを使って複数回学習させたいです。 例えば下記のようなCSVデータA、データB、データCがあるとします。 名前 能力A 能力B 能力C 順位 山田 10 5 3 1 佐藤 3 4 5 2 田中 4 2 0 3 名前 能力A 能力B 能力C 順位 鈴木 0 9 7 2 伊藤 1

    • 0評価
    • 32PV
    syakwti syakwti 2日前に 質問を編集
  • 解決済

    回答
    2

    Pythonを使った機械学習でグループごとに学習させたい

    前提・実現したいこと 機械学習でグループごとに学習させたいです. 例えば自動車レースで順位予測をしたい時に 下記のようなデータがあるとします. 開催日時 コース ドライバー 車種 着順 出走台数 xxxx 1 佐藤 A 1 6 xxxx

    • 0評価
    • 115PV
    syakwti syakwti 2日前に ベストアンサー
  • 解決済

    回答
    1

    pandasを使用したデータ処理に関して

    前提・実現したいこと 以下のようなデータフレームtableAを作成したとします。 tableAの最初の一行のみを抜き出して、新しいデータフレームを作成したいです。 import pandas as pd tableA = pd.DataFrame([["0001", "Smartphone"], ["0001"

    • 0評価
    • 60PV
    papi_tokei papi_tokei 6日前に ベストアンサー
  • 解決済

    回答
    1

    n行ごとに新しい列にデータを移す(Pandas/Python)

    Pandas(Python)で1列にまとめられたデータをn行ごとに新しい列に移すにはどうすればよいのでしょうか。 具体的には、a1列にある数値を4行ごとに新しい列に移すということをしたいです。列のラベルに関しては、以下のようなリストを使用したいです。 columnname = ['a1','a2','a3','a4','a5','a6','a7','a8

    • 0評価
    • 49PV
    magichan magichan 1週間前に コメント
  • 解決済

    回答
    2

    Pandas(Python)でしきい値判定

    Pandasでデータフレームを扱っています。 A列のデータについてしきい値で判定を行いたいです。 しきい値(5以上) を超えた場合には1を、超えなかった場合は0という結果をB列に入力したいです。 作りたいもの A B 0 1 0 1 2 0 2 3 0 3 4 0 4 5 1 5 6 1 6 7 1 7 8 1

    • 0評価
    • 67PV
    mu373 mu373 1週間前に ベストアンサー
  • 解決済

    回答
    1

    pandasによるDataFrameのエクセルへの書き込み

    pandasのdataframeの列名のみをエクセルに書き込みたいと考えています。 import pandas as pd a = pd.DataFrame( {'name': ['Danny', 'Jess', 'Joey', 'D.J.', 'Steph', 'Michelle'], 'age': [29, 24, 29, 10,

    • 0評価
    • 38PV
    MizutaniTakuya MizutaniTakuya 2週間前に ベストアンサー
  • 解決済

    回答
    1

    pandas(Python)で範囲を指定して和を求める

    PythonのPandasのデータフレームで、以下のような計算処理をしたいと考えています。 B2だったら A0+A1+A2 のように、3行分の値を足し合わせてB列に代入するためにはどうすればよいのでしょうか。 Excelのように範囲を指定して和を求める方法を教えてください。 3行ごとにグループにすることによって集計できるのではないかと考えたのですが、うま

    • 0評価
    • 52PV
    mu373 mu373 2週間前に コメント
  • 解決済

    回答
    1

    読み込んだデータに名前をつける方法とそのデータの列を抽出する方法

    初学者ですので教えていただきたいです。 手元にあるデータの列に名前をつけて、それらの各列を抽出したいです。 例)7.31E-02の上にA -3.82E+00の上にB ](ba16f9c6aae44694a69a36666b1b037f.png) データとnames=['A','B','C','D','E','F','G','H']の位置が正しく入力さ

    • 0評価
    • 55PV
    ago-japan ago-japan 2週間前に コメント
  • 解決済

    回答
    2

    二次元グラフを作成したいです

    初学者なのでどこから手を出して良いかわかりません。 center of pressure(足圧中心)という実験の二次元グラフです。 これを自作したいのですが、コードやアプローチ方法が全くわかりません。 宜しくお願い致します。

    • -1評価
    • 76PV
    magichan magichan 2週間前に ベストアンサー
  • 解決済

    回答
    2

    pandas で事業年度毎に groupbyしたい

    YYYY-03-01から(YYYY+1)-02-29をYYY年度としてまとめたい 2010-03-01 から 2011-02-29 2010年度 hoge.csv ymd a b 2010-03-01 1 6 2010-06-30 2 7 2010-10-30 3 8 2011-02-29 4 9 2012-06

    • 0評価
    • 61PV
    yuntas yuntas 3週間前に コメント
  • 受付中

    回答
    1

    pandasでcsvから読み込んだデータを日付ごとにリストにしたい

    現在,csvファイルの中身を読み込んで,日付ごとにリストにしたいと考えています. しかし,csvファイルのデータが少し厄介なもので,うまくデータを処理できません. 0列目が日付のデータなのですが,日付以外にも時間が付与されています. 例とすると 日付 2014/01/01 0:00:00 2014/01/01 0:00:05 2014/01/01

    • 0評価
    • 73PV
    magichan magichan 3週間前に 回答
  • 受付中

    回答
    0

    エクセルデータのpython-pandasを用いた読み込み

    前提・実現したいこと python-numpy-pandasを用いて、 3次元曲面を回帰分析によって導出したいのですが、その座標データはエクセルのxlsxファイルです。 @@1 2 3 4 5 6・・・・・ 1 2@@4 5 1 0 3 4 横にx座標データが続き、縦にyの座標データが、それに対応するz座標データがあります。 例えば、(x,y,z)=(3,2

    • 0評価
    • 125PV
    teratailが1ヶ月前に アップデート
  • 解決済

    回答
    2

    異なるデータフレーム間でのインデックス名を使用した値の上書きについて

    前提・実現したいこと df = pd.DataFrame([[1,4,7],[2,5,8],[3,6,9]], index = ['i1','i2','i3'], columns = list("abc")) df2 = pd.DataFrame([[11,14,17],[13,1

    • 0評価
    • 76PV
    wargod_elec wargod_elec 1ヶ月前に コメント
  • 解決済

    回答
    1

    movie_id title user_id ratingの順に列に表示される理由

    movie_id title user_id ratingの順に列に表示される理由がわかりません。 import pandas as pd r_cols = ['user_id','movie_id','rating'] ratings = pd.read_csv('DataScience/ml-100k/u.data',sep='\t',name

    • 0評価
    • 57PV
    magichan magichan 1ヶ月前に ベストアンサー
  • 解決済

    回答
    1

    pd.DataFrameから、ある列で同じ値のものを分割して別々のDataFrameにしたい

    前提・実現したいこと id スコア 0001 1528 0001 105090 0001 78936806 0002 23 0002 54170 0003 6952 0003 748569120 0004 14680 0004 69325 ... ... というようなcsvから読み込んだDataFrameを 同じi

    • 0評価
    • 75PV
    machiko4740 machiko4740 1ヶ月前に コメント
  • 解決済

    回答
    1

    Pandasのデータフレームの複数の列に対して特定の値を含むものを抽出したい。

    前提・実現したいこと Python3系のPandasを利用して、複数の列に対して特定の値が含むものを抽出したいです。 例えば、 . C1 C2 A True False B False False C False True というデータフレームに対して値がTrueのものを抽出したいです。 結果の例としては . C1 C2 A

    • 0評価
    • 95PV
    wargod_elec wargod_elec 1ヶ月前に コメント
  • 解決済

    回答
    1

    index.reshapeの代わり

    困っていること pythonで index.reshape の代わりになるコードはありませんか? 発生している問題・エラーメッセージ NotImplementedError: reshaping is not supported for Index objects 該当のソースコード X = cikibake.index.astype('int64'

    • 0評価
    • 70PV
    can110 can110 1ヶ月前に ベストアンサー
  • 解決済

    回答
    2

    pandasによるデータ操作

    pandasでのデータ抽出に関してわからないことがあります。 例えば以下のようなpandasのDataframeとnumpy配列があったとします。 a = pd.DataFrame({ 'A' : [1,2], 'B' : [3,4], 'C' : [5,6], 'D' : [7,8]}) print(a) b = np.array([0,1,0,1]

    • 0評価
    • 75PV
    MizutaniTakuya MizutaniTakuya 1ヶ月前に コメント
  • 受付中

    回答
    1

    pandas 正規化の際のエラー

    pandasで正規化しようと思たのですが、このようなエラーメッセージが出ます。何を直せばいいのでしょうか? (python3.6) m = df.mean() s = df.std() df = df.sub(m,axis=0).div(s,axis=0) ValueError: cannot reindex from a duplicate axi

    • 0評価
    • 71PV
    magichan magichan 1ヶ月前に 回答
1

タグ情報

  • あなたの順位

    -

  • タグ登録者数

    46

  • 総質問数

    121

  • 今週の質問数

    3

関連するタグ

思考するエンジニアのためのQ&Aサイト「teratail」について詳しく知る