質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.46%
VBA

VBAはオブジェクト指向プログラミング言語のひとつで、マクロを作成によりExcelなどのOffice業務を自動化することができます。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Q&A

解決済

1回答

613閲覧

データセットの作り方

s_kj

総合スコア32

VBA

VBAはオブジェクト指向プログラミング言語のひとつで、マクロを作成によりExcelなどのOffice業務を自動化することができます。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

0グッド

1クリップ

投稿2020/06/28 12:40

機械学習初学者の質問です。

機械学習を始めようと思い、データセットの元となるCSVファイルの取得を完了しました。

しかし、現状ではただのデータの羅列で、どの列が答えに当たるのか、どの行を特徴量とするのかなどの加工はできていません。
この場合、皆様はどのプログラムを使用して加工されますか?

ネットで調べますと、欠損値の除去などの前処理に当たる工程は、Pandasなどがあると理解していますが、ネットでは調べきれなかった部分もあり質問しています。

データセットの加工のポイント
・特徴量同士の掛け算などの演算操作で変換した新たな特徴量を作成したい。
・例になりますが、特徴量No.1〜10の中で最大と最小の値を持つ特徴量を取り出し、最大値・最小値以外の特徴量は削除したい
・ある一定の条件に見合う特徴量を含んだデータのみのデータセットに変更したい。
・条件分けしてデータに答えのラベルを振りたい。

今後、クローリングなどでデータが日々蓄積していくことも想定されます。
VBAなどで加工するのが良いのでしょうか。

ご回答お願い致します。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

meg_

2020/06/28 12:46

「前処理に当たる工程は、Pandasなどがあると理解していますが、ネットでは調べきれなかった」とありますが、最初から調べきることは難しいのでまずはコードを書いて実行してみるのが良いと思います。
guest

回答1

0

ベストアンサー

・特徴量同士の掛け算などの演算操作で変換した新たな特徴量を作成したい。
・例になりますが、特徴量No.1〜10の中で最大と最小の値を持つ特徴量を取り出し、最大値・最小値以外の特徴量は削除したい
・ある一定の条件に見合う特徴量を含んだデータのみのデータセットに変更したい。
・条件分けしてデータに答えのラベルを振りたい。

上記のやりたい事に対して、「どのライブラリを使えばできますか」というのが質問内容とするならば、pandas で上記は全部できます。
テーブルデータの加工で pandas でできない事はほぼないと思うので、pandas を勉強すればよいと思います。

参考書を1つ挙げておきます。
pandas の著者が書いた書籍で、これ1冊読めば pandas の使い方はほぼマスターできます。

Pythonによるデータ分析入門 第2版 ―NumPy、pandasを使ったデータ処理 | Wes McKinney, 瀬戸山 雅人, 小林 儀匡, 滝口 開資 |本 | 通販 | Amazon

VBAなどで加工するのが良いのでしょうか。

Python でそのあとデータ分析するのであれば、その前処理のテーブルデータの加工も pandas など Python 上でやったほうが生産性は高くなると思います。

投稿2020/06/28 12:56

編集2020/06/28 13:00
tiitoi

総合スコア21956

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

s_kj

2020/06/28 13:57

コメントありがとうございます。 玄人の方からのご意見大変参考になります。 ベストアンサーにさせていただきました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.46%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問