pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

RSS

  • 受付中

    回答
    1

    pandasデータ整理、rankの処理

    前提・実現したいこと 乱雑に数字の入ったcsvファイルを読み込んで、小さい順に数字を1から+1ずつ順に割り振っていきたい。(タイの数値は同値で) 例:[7,-5,7,4,2,0,4]なら小さい順に振っていき 7 5 -5 1 7 5 4 4 2 3 0 2 4 4 としたいわけ

    • 0評価
    • 20PV
    magichan magichan 1時間前に 回答
  • 解決済

    回答
    1

    データフレームの前の行との差分を元のデータフレームに追加したい

    前提・実現したいこと お世話になります。 データフレームの操作方法について皆様のお知恵を拝借いただけないでしょうか。 目標としては、データフレーム内対象の列においてn行目からn−1行目を引いた数値をdeff列として元のデータフレームに追加したいです。(一行目の算出は0としたいです) 下のようなデータフレームがあるとします。 x -3954305.

    • 0評価
    • 13PV
    tunamayo1222 tunamayo1222 3時間前に コメント
  • 解決済

    回答
    1

    pandasでhtmlからテーブルを取得する

    あるサイトのhtmlからテーブルをpandasで抜き出したい。 from selenium import webdriver import pandas as pd import requests from bs4 import BeautifulSoup driver = webdriver.PhantomJS() driver.set_window

    • 0評価
    • 66PV
    DaichiYasuda DaichiYasuda 20時間前に コメント
  • 解決済

    回答
    1

    複数xlsxからのデータコピーができない。

    前提・実現したいこと はじめまして。最近Pythonを使って、特定フォルダ直下の複数のExcelファイルから複数個所データをピックアップし、データを加工した後別のExcelファイルに書き出すスクリプトを作成しようとしています。 そのさい、下記メソッドを作成したのですが、一つ目の箇所のデータはうまく抜き出せるのですが、2つ目以降はデータがコピーされません。

    • 0評価
    • 33PV
    H.Kazuyuki H.Kazuyuki 3日前に コメント
  • 解決済

    回答
    1

    データを結合すると欠損値が出来てしまう問題を解決したい

    データを結合すると欠損値が出てきてしまう問題を解決したいです。 現在、2つデータがあるので結合させたいのですが結合させるとなぜか欠損値が出ます。 各データは、結合するまでは、欠損値はありません。 結合すると出てきます。 データの構造は、(1880,23)と(1880,)です。 以下のコードで結合させました。 b_data =pd.DataFram

    • 0評価
    • 60PV
    syakwti syakwti 5日前に コメント
  • 解決済

    回答
    1

    pandasのDataFrameにSeriesを特定の場合において追加できない

    はじめまして PandasのDataFrameにSeriesを結合する際に、特定の場合においてエラーが出て困っています。 具体的には、結合するSeriesの一つの値をNaNからpd.Timestampクラスの値に変えたものを追加しようとするとエラーが出てしまいます。 以下が具体的な問題です。 発生している問題・エラーメッセージ 初期のデータフレームは以下

    • 1評価
    • 70PV
    kamome283 kamome283 6日前に コメント
  • 解決済

    回答
    1

    PandasかNumpy for文を用いて行を抽出

    環境:Python3.6,win10 プログラミング初心者です。表題の作業をしたいと考えています。具体的には行列 0,1,2,3,4,5,6,7,8,9 9,8,X,6,5,X,3,2,1,0< 0,1,2,3,4,5,6,7,8,9 ………… 9,8,7,6,5,4,3,2,1,0, 0,1,2,X,4,5,6,7,8,9,< において、「任意のカラム

    • 0評価
    • 46PV
    ak_miyamoto ak_miyamoto 1週間前に コメント
  • 受付中

    回答
    3

    【pandas】時間データをもとに1日の最高気温を求めたい

    時系列データをpandas.datetime型に変換して扱っています。 いま、データはA年B月C日D:00という状態になっています。また、datetimeの列とは別に、気温列(int)があります。 このデータから、日ごとの最高温度を求めたいです。 pd.resample()を使うとできるようなんですが、うまくいきません。 どのようにすれば、時

    • 0評価
    • 74PV
    magichan magichan 1週間前に 回答
  • 解決済

    回答
    2

    ファイルを読み込んでリストに格納する方法

    1 政治・経済 2 生活 3 文化・習慣 4 スポーツ ・ ・ ・ のような内容が書かれているtxtファイルがあったときにそれを読み込み、数字以外の単語をリストに格納したいのですが、どのようにすればいいのでしょうか? 特に悩ましいのは・で区切られた単語も別々な要素として格納したいというところで、調べてもよく分かりません。pandasを使えばできそうな事は分か

    • 0評価
    • 65PV
    ryuuu.ss ryuuu.ss 1週間前に コメント
  • 解決済

    回答
    1

    input関数でグラフラベルの条件一致方法

    実現したいこと CSVファイルを読み込んだ後、B列とC列を手入力で日付と時間を指定してX軸に、手入力でD列とE列に適切な値を入力してJ列以降のデータ列をY軸に当て、最後に、上記の条件に適切なX軸,Y軸のグラフを出力させたい。 前回と同じ質問になり恐縮ですが、再度質問させていただきます。 読み込みファイル構造 Date ClockTime

    • 0評価
    • 72PV
    bkts94441 bkts94441 1週間前に コメント
  • 解決済

    回答
    1

    Pandas ログ解析時系列データで毎時(分)のアイテム別出現頻度カウント

    Pandasのデータフレームで以下のようなデータがあります。指定した時間頻度で毎時、毎分、毎秒など集計はする事はできるのですが、Infoの各要素毎の出現カウントを指定した時間頻度で集計するにはどうすればよいでしょうか? Grouper, resample, aggなどを組み合わせる事で実現できそうではあるのですが、苦戦しております。ご教授の程よろしくお願いい

    • 0評価
    • 52PV
    minhouse10 minhouse10 1週間前に ベストアンサー
  • 解決済

    回答
    1

    データ分析の際のデータベースの作り方

    PythonのPandasでデータ分析をしたいのですが、 データベースを作る際に、データを取り出しやすく使いやすくするためのコツ、気を付けないといけない注意点などありましたら教えてください。 よろしくお願いします!

    • 0評価
    • 85PV
    tuna.py tuna.py 1週間前に ベストアンサー
  • 解決済

    回答
    1

    pythonで散布図の点と元データを関連付けをしたい

    実現したいこと 1.png 220 190 192 194 195 〜 2.png 165 143 144 145 146 3.png 179 179 176 169 169 4.png 166 143 145 1

    • 0評価
    • 96PV
    can110 can110 1週間前に ベストアンサー
  • 解決済

    回答
    1

    pandas : 条件によって値の要素を変更する時の記述について

    スマートな記法があれば教えてください。 以下のようにいちいち if 文とかで条件分けするのが煩わしい import pandas as pd df = pd.DataFrame([['1', 10], ['2', 20], ['3', 30]]) df for i in range(len(df)): target = df.at[i,0]

    • 0評価
    • 70PV
    yuntas yuntas 1週間前に コメント
  • 解決済

    回答
    3

    Pythonで日時表記を24:00から00:00に変更したい

    yyyymmddhhmm形式の時刻を24:00から00:00に変更したいのですがはまってしまいました。 例)201303042400(2013年3月4日24時00分) → 201303050000(2013年03月05日00時00分) import datetime import pandas as pd x = '201303042400' y =

    • 0評価
    • 94PV
    yozakura yozakura 1週間前に コメント
  • 解決済

    回答
    2

    Pandasデータフレームのある列同士を比較

    Pandasで共通のキーを持たない2つの異なるデータフレーム、df1とdf2があり、それぞれの列の要素として、IPV6アドレスの一部を含むdf1の列Aの要素が、df2の列BのIPV6に含まれていたら、df2の列Bに対応する列Aの情報をdf1の新たな列Cとして追加するというような、ExcelのVlookup関数のような結果を期待しております。要素の型はObje

    • 0評価
    • 84PV
    minhouse10 minhouse10 1週間前に コメント
  • 解決済

    回答
    1

    pandas groupbyで文字列を値とした場合について

    groupbyに関して、文字列を値とした場合に、集約関数max(),min()を適用して得られた結果が理解できません。最大、最小をどのように捉えればいいのでしょうか。教えて頂けると幸いです。 df = pd.DataFrame({'Customer': list('AAAABBB'), 'Product': ['TV'

    • 0評価
    • 55PV
    .me .me 1週間前に ベストアンサー
  • 解決済

    回答
    3

    Pythonで、リスト内の特定値が要素の頭から何回連続で出現するかを数えたいです

    前提・実現したいこと pythonでCSVファイルの各行をリストとして取り出し、 リスト内の特定値が要素の頭から何回連続で出現するかを数えたいです 例えば特定値が0として、csvが data1,data2,data3,data4 0,0,0,0 0,1,3,0 1,0,4,1 とするならば、 data1,data2,data3,data4,co

    • 0評価
    • 96PV
    Phillip Phillip 1週間前に コメント
  • 解決済

    回答
    1

    Pandas Dataframe で column毎に indexを設定してグラフ化したい

    前提・実現したいこと 任意の波形を組み合わせて 比較分析する際、データの検索や表示がエクセルでは重くなりすぎて扱いづらく、 Python・Pandas で解決できないか考えています。 具体的には、 データフレーム形式になっている多数のcsvファイルの中から 1列ずつ読み込んで任意の組み合わせで別のデータフレームを組み上げ、 最後にpandasのプロット機

    • 0評価
    • 104PV
    Ruthird Ruthird 2週間前に コメント
  • 解決済

    回答
    1

    Python3.6 Pandasを用いたCSVファイルの抽出

    前提・実現したいこと Python3.6 Pandasを用いて、ファイル”XXX.csv”を読み込み、column”AA”において"BBB"を含むindexを抽出し、”XXX2.csv”として出力したいと考えています。 発生している問題・エラーメッセージ C:\Users\mymt_akck\Anaconda3\python.exe C:/Users/m

    • 0評価
    • 68PV
    ak_miyamoto ak_miyamoto 2週間前に コメント
1

タグ情報

  • あなたの順位

    -

  • タグ登録者数

    68

  • 総質問数

    205

  • 今週の質問数

    5

関連するタグ

pandasタグのよく見られている質問

思考するエンジニアのためのQ&Aサイト「teratail」について詳しく知る