質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.50%

  • Python

    8007questions

    Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

  • pandas

    584questions

    Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

  • NumPy

    448questions

    NumPyはPythonのプログラミング言語の科学的と数学的なコンピューティングに関する拡張モジュールです。

object型からnp.float32への変換方法

解決済

回答 3

投稿 編集

  • 評価
  • クリップ 0
  • VIEW 242

loreeeee

score 16

以下のコードはサイトのhtmlをpandasで抽出しdataframeにまとめ,特定の要素を抽出するコードです.要素抽出まではできたのですが,抽出した全要素の型をobject型⇒np.float32に変換したいのですが,AttributeError: module 'pandas' has no attribute 'float32'と怒られてしまいました.どなたか型変換の方法を教えていただけないでしょうか?

以下,コードと出力結果です.環境はpython3.6 on anacondaです

import pandas as pd

url='http://163.49.30.82/cgi-bin/DspWaterData.exe?KIND=6&ID=303031283301010&BGNDATE=20021201&ENDDATE=20021231&KAWABOU=NO'
dfs = pd.read_html(url, header=0,index_col=0)#htmlを読み込む
df = dfs[1] #headerを取り除く
#print(df)

raw_data = df.values #値を格納
data = raw_data[1,:] #data.shape is (1,24)
#data = raw_data[1,:] #要素を抽出
print(data)
print('type(data): ', type(data))
print('data.dtype: ', data.dtype)

data_float = data(dtype=np.float32) #object -> np.float32に変換
print(type(data_float))


出力結果は

['222.67' '241.94' '234.14' '226.46' '222.67' '226.46' '222.67' '211.49'
 '211.49' '209.66' '204.20' '198.82' '186.53' '177.99' '172.97' '166.38'
 '161.52' '161.52' '164.75' '172.97' '190.00' '195.27' '193.50' '190.00']
type(data):  <class 'numpy.ndarray'>
data.dtype:  object
---------------------------------------------------------------------------
AttributeError                            Traceback (most recent call last)
<ipython-input-39-f78f10ab5754> in <module>()
     16 print('data.dtype: ', data.dtype)
     17 
---> 18 data_float = data(dtype=np.float32) #object -> np.float32に変換したい...
     19 print(type(data_float))
     20 

AttributeError: module 'pandas' has no attribute 'float32'
  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 3

checkベストアンサー

0

文字列ならnumpyの文字列型になりそうな気がしますが・・・まあ読み込み方によってはオブジェクト型もあり得るのか。

そして
AttributeError: module 'pandas' has no attribute 'float32'
というエラーメッセージがとても不可解な気がします。import pandas as npとかうっかりどこかに書いてたりしない?

それはそれとして、単純に型変換したければ

data_float = data.astype(np.float32)

でできるんじゃないかなぁ、と思います。でもまずはAttributeErrorを解消しないと駄目ですけど。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2018/07/05 21:25

    >import pandas as npとかうっかりどこかに書いてたりしない?
    書いてありました.それでよくわからないエラー文が出てしまったのですね...jupyter-notebbok上で作業していたのですが,,こういうのに気をつけないといけないのですね.自分の不注意でした.
    型変換も回答の方法でできました.ありがとうございました.

    キャンセル

0

オブジェクト data が配列であることは、出力結果から明らかだと思います。

['222.67' '241.94' '234.14' '226.46' '222.67' '226.46' '222.67' '211.49'
'211.49' '209.66' '204.20' '198.82' '186.53' '177.99' '172.97' '166.38'
'161.52' '161.52' '164.75' '172.97' '190.00' '195.27' '193.50' '190.00']
type(data):  <class 'numpy.ndarray'>
data.dtype:  object

24個の実数からなる配列 data を、1つの実数にするには

  1. 最初の要素の値を使う (data[0])
  2. 全部の要素の合計を使う
  3. 要素の平均を使う
  4. 最後の要素の値をつかう (data[len(data)-1])
    というような操作/変換のいずれかをしなくてはなりません。

loreeeeeさんは、以下の配列から、どのような実数が出てきたら満足ですか?

['222.67' '241.94' '234.14' '226.46' '222.67' '226.46' '222.67' '211.49'
'211.49' '209.66' '204.20' '198.82' '186.53' '177.99' '172.97' '166.38'
'161.52' '161.52' '164.75' '172.97' '190.00' '195.27' '193.50' '190.00']

まず、どうしたいのかを決めましょう。それが決まれば、コードにする方法はあります!

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2018/07/05 18:36 編集

    目的が不明遼でしたので編集しました.
    やりたいことは['222.67' '241.94' '234.14' '226.46' '222.67' '226.46' '222.67' '211.49'
    '211.49' '209.66' '204.20' '198.82' '186.53' '177.99' '172.97' '166.38'
    '161.52' '161.52' '164.75' '172.97' '190.00' '195.27' '193.50' '190.00']の各要素はstr型になっているので全ての要素をnp.float32に変換する作業になります.

    キャンセル

0

単純に読み込み方の問題かと思います。

1行目の余分なデータを skoprowsを用いてスキップすると、何の問題も無く
全てのデータが float64で読み込めました。

import pandas as pd

url = 'http://163.49.30.82/cgi-bin/DspWaterData.exe?KIND=6&ID=303031283301010&BGNDATE=20021201&ENDDATE=20021231&KAWABOU=NO'
df = pd.read_html(url, skiprows=[0], header=[0], index_col=0)[1]
print(df.dtypes)
#1時     float64
#2時     float64
#3時     float64
#4時     float64
#5時     float64
#6時     float64
#7時     float64
#8時     float64
#9時     float64
#10時    float64
#11時    float64
#12時    float64
#13時    float64
#14時    float64
#15時    float64
#16時    float64
#17時    float64
#18時    float64
#19時    float64
#20時    float64
#21時    float64
#22時    float64
#23時    float64
#24時    float64
#dtype: object

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 90.50%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

同じタグがついた質問を見る

  • Python

    8007questions

    Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

  • pandas

    584questions

    Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

  • NumPy

    448questions

    NumPyはPythonのプログラミング言語の科学的と数学的なコンピューティングに関する拡張モジュールです。