pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

RSS

  • 受付中

    回答
    2

    データの中にリストがある場合の取扱について:Pandas

    前提・実現したいこと 度々失礼します。 今回はやりたいこととしては, 複数のファイルからデータを読み込んで,重複を削除して出力をする ということをしたいです。 対象としているファイルは次のような、時間と機械の番号が書かれたJSONファイルです。 {"machine":[{"No":"G1"}],"time":149482460

    • 0評価
    • 36PV
    pepasuke623 pepasuke623 14時間前
  • 解決済

    回答
    1

    jsonファイルを読み込んで、重複削除を行う:Pandas

    前提・実現したいこと お世話になります。 jsonファイルを読み込んでデータフレームに代入して、重複削除をしたいと思っています。 ディレクトリの中には、次のようなjsonファイルが沢山あります。 // 0001.json {"machine":"A3","times":1494824607024} "machine"は稼働した機械の名称。

    • 0評価
    • 47PV
    pepasuke623 pepasuke623 4日前
  • 解決済

    回答
    2

    pandasで散布図を作成したい

    したいこと 下記のcsvファイルがあります X軸に乗客、y軸にうどんをセットして散布図を作成したいです。 駅,うどん,乗客 青井駅,9,1000 新橋駅,100,100000 東京駅,222,200000 立川駅,100,1000 pandasのplot勉強中でわからないので教えていただきたいです。

    • 0評価
    • 74PV
    DaichiYasuda DaichiYasuda 6日前
  • 解決済

    回答
    1

    pandas で、数値(float)の列から、sprintf のような処理をして、別の列をつくりたい...

    pandas で、2.019378e+01 のような float の列にsprint のような処理を加えて、20.19 (整数部2桁、小数点以下2桁)のように簡単に変換するにはどうするのがいいのでしょうか? ループを回すような面倒な方法しかないのでしょうか?

    • 0評価
    • 34PV
    zanjibar zanjibar 5日前
  • 受付中

    回答
    1

    flagmatplotlibで日本語を表示したい

    下記のコードでグラフを作成して描画すると日本語が表示されません。 import pandas as pd from matplotlib import pylab as plt df = pd.read_csv('test.csv') fig = df.plot.scatter(y=u'うどん', x=u'乗客') for k, v in df.i

    • 0評価
    • 49PV
    DaichiYasuda DaichiYasuda 6日前
  • 解決済

    回答
    1

    Python/Pandasのparse_dates[]オプションに対するNotImplemented...

    Excelから時系列の列データを読み込み、matplotlibグラフのY軸にとる際以下のエラーが発生します。Pandas0.16等、古いバージョンのPandasでは発生していなかったエラーです。Anacondaのパッケージを更新して以降エラーが発生するようになりました。エラーを検索すると既にバグとしては報告されているようですが、具体的にどのように解決するのか

    • 0評価
    • 42PV
    minhouse10 minhouse10 1週間前
  • 解決済

    回答
    1

    Youtube統計情報の取得list index out of rangeを無視したい

    いつもお世話になっております。 実現したいこと 以下のコードのlist index out of rangeを強制的に無視してrangeを幅広く出力したい。(apiの限界の限り) 問題のコードは以下 import requests import json DEVELOPER_KEY = "myapikey" YOUTUBE_API_SE

    • 0評価
    • 73PV
    Tweet_from_JG Tweet_from_JG 1週間前
  • 解決済

    回答
    1

    2つのデータフレームを比較して、ある時間に該当するものを重複を削除した上で出力する:Pandas

    前提・実現したいこと お世話になります。以前の質問から派生して、下記のようなことを実現したいと思います。 機械が稼働する時間のデータ(machine.csv)とある時間に投入される材料データ(material.csv)がある (machine.csv)の['machine']はその時間に稼働している機械のID,['time']はその時間を意味

    • 0評価
    • 71PV
    pepasuke623 pepasuke623 1週間前
  • 受付中

    回答
    1

    python の pandas_datareader のインポートでエラーが出ます。

    前提・実現したいこと pythonで pandas_datareaderを使いたいのですがimportでエラーが出ます。原因と解決方を教えてください。よろしくお願いします。 発生している問題・エラーメッセージ >>> import pandas_datareader Traceback (most recent call last): File

    • 0評価
    • 67PV
    ShoseiKawai ShoseiKawai 1週間前
  • 解決済

    回答
    1

    pandas groupby での 条件抽出の結果について

    前提・実現したいこと Python の pandas groupbyにてデータの集計方法の質問です。groupby でグループ内のある条件を満たす最小値が欲しいです。その際に、条件を満たさないグループの項目も残したいのですが、どのように書くのがpandasのイディオムなのでしょうか?自分の例ではout3では求められましたが冗長な書き方と感じましたので質問し

    • 0評価
    • 57PV
    lump333 lump333 1週間前
  • 解決済

    回答
    1

    より良い表現 pandas, dict, numpy. 3つの多次元変数にラベルをつけ,vstack...

    以下のようなコードをを完結に表現する方法はありますでしょうか. s,z,xという変数にラベルをつけ,それをvstackしたいです. s = np.arange(15).reshape(5,3) z = np.arange(30).reshape(10,3) x = np.arange(30).reshape(10,3) label= {0:'s',

    • 0評価
    • 68PV
    hfadslf88yfs hfadslf88yfs 2週間前
  • 受付中

    回答
    2

    Pythonで3列のデータフレームを距離行列(類似度行列)に変換する方法を教えてください。

    前提・実現したいこと >>> import pandas as pd >>> df = pd.read_csv("test.csv") >>> df.shape (6204141, 3) >>> df.head() item1 item2 similar 0 AAA BBB 4.820050e-05 1 CCC DDD 1.61

    • 0評価
    • 83PV
    yamamura yamamura 2週間前
  • 解決済

    回答
    1

    ネストされた辞書型について(python pandas)

    MovieLensのratings.csvを使用して以下の出力結果を得たいと思っています. ※ userId,movieId,rating,timestanpはカラム名で実際は値が入ります. {‘userId’:{‘movieId’:{‘rating’, ‘timestanp’}}} 例) {1: {31: {2.5, 1260759144},…..}

    • 0評価
    • 95PV
    utoka utoka 3週間前
  • 解決済

    回答
    1

    Webサイトから取得したデータが加工できません。

    前提・実現したいこと Python初心者で勉強中です。サンプルの行き先表示板を題材にして「名前」「更新(時刻)」「行き先」を取り込み、DBへ格納することを実現しようとしています。 ※実際に会社で運用して勤怠に使おうかと考えています。 取得したデータ [ 0 1 2 3

    • 0評価
    • 95PV
    IrohaAi IrohaAi 3週間前
  • 解決済

    回答
    1

    グラフの結果がわからない

    グラフの結果がわからないです。 import statsmodels.api as sm import statsmodels.formula.api as smf import numpy as np,pandas as pd,matplotlib.pyplot as plt n = 20 x1 = np.linspace(1,n-1,n) y =

    • 0評価
    • 75PV
    rrrrrrrr rrrrrrrr 3週間前
  • 解決済

    回答
    2

    出力順番が理解できない

    出力順番が理解できないです。 # coding: utf-8 from __future__ import absolute_import from __future__ import division from __future__ import print_function from scipy import sparse import os i

    • 0評価
    • 90PV
    rrrrrrrr rrrrrrrr 4週間前
  • 解決済

    回答
    1

    cursor()メソッドを使うときと使わないとき

    cursor()メソッドを使うときと使わないときの違いがわかりません。 今Pythonを使ってSQL文を実行することを勉強しています。 conn = psycopg2.connect("dbname=dq user=dq") conn.autocommit = True cur = conn.cursor() cur.execute("DROP DA

    • 0評価
    • 108PV
    rrrrrrrr rrrrrrrr 1ヶ月前
  • 解決済

    回答
    1

    時間ごとに単純移動平均を計算する:Pandas

    前提・実現したいこと お世話になります。時間ごとに区切って単純移動平均を出したいと思っています。 例えばこんなデータがあるとします。 //data.csv time,val 10:00:00.111,65 10:00:00.555,68 10:00:00.888,37 10:00:01.111,34 10:00:01.222,36 10:00:

    • 0評価
    • 132PV
    pepasuke623 pepasuke623 1ヶ月前
  • 解決済

    回答
    1

    python xmlrpclib ブログ投稿

    import sys import xmlrpclib import pandas import pandas as pd df = pd.DataFrame({'column1':[1,2], 'column2':[3,4]}, index = ['index1','index2']) print df df2 = df.to_html() print

    • 0評価
    • 79PV
    hiroway hiroway 1ヶ月前
  • 解決済

    回答
    1

    ナイーブベイズ分類器のエラーについて

    ナイーブベイズ分類器でy(トレーニングセットのラベル)とx(単語ベクトル)で、yは(1204,2)、xは(1204,1496)の行列、これらで学習させようとしました。そしたら下記のようなエラーメッセージが出てきてしまいました。 import numpy as np from sklearn.naive_bayes import GaussianNB #

    • 0評価
    • 109PV
    trafalbad trafalbad 1ヶ月前
1

タグ情報

  • あなたの順位

    -

  • タグ登録者数

    38

  • 総質問数

    98

  • 今週の質問数

    5

関連するタグ

思考するエンジニアのためのQ&Aサイト「teratail」について詳しく知る