質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.37%
CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

MySQL

MySQL(マイエスキューエル)は、TCX DataKonsultAB社などが開発するRDBMS(リレーショナルデータベースの管理システム)です。世界で最も人気の高いシステムで、オープンソースで開発されています。MySQLデータベースサーバは、高速性と信頼性があり、Linux、UNIX、Windowsなどの複数のプラットフォームで動作することができます。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

3144閲覧

MySQLにインポートしたcsvファイルのデータがおかしい

fran_fran

総合スコア6

CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

MySQL

MySQL(マイエスキューエル)は、TCX DataKonsultAB社などが開発するRDBMS(リレーショナルデータベースの管理システム)です。世界で最も人気の高いシステムで、オープンソースで開発されています。MySQLデータベースサーバは、高速性と信頼性があり、Linux、UNIX、Windowsなどの複数のプラットフォームで動作することができます。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2020/08/09 09:00

Mysqlの「Table Data Import Wizard」を使ってcsvをファイルをインポートしてみたのですが、一部のカラムが正確にインポートされないという現象が発生しております。

csvファイルはkaggle(https://www.kaggle.com/azathoth42/myanimelist?select=anime_cleaned.csv)で公開されている「anime_cleaned.csv」というファイルです。

このファイルをjupyter notebookで開く分には問題ないのですが、mysqlに取り込むと、本来のデータと違う内容で取り込まれており、どうすれば元のデータのとおりインポートできるか解決法があればご教示いただけますでしょうか。

例えば、duration というカラムでは本来であれば「24 min. per ep.」といったデータになるはずなのですが、空欄や0になっていたり、
episodeというカラムでは「12」や「26」といった数値データが入るはずのところ、全く関係のない数字が入ってしまったり、
また、producer というカラムでは「TV Tokyo, AIC, Square Enix, Sotsu」といったデータになるところ、数値データに置き換わっていたりと、複数のカラムでデータのインポートが正確にできておりません。
この点について、皆様のお知恵をお借りできましたら幸いです。

イメージ説明

(anime_cleaned.csvのカラム)
anime_id int64
title object
title_english object
title_japanese object
title_synonyms object
image_url object
type object
source object
episodes int64
status object
airing bool
aired_string object
aired object
duration object
rating object
score float64
scored_by int64
rank float64
popularity int64
members int64
favorites int64
background object
premiered object
broadcast object
related object
producer object
licensor object
studio object
genre object
opening_theme object
ending_theme object
duration_min float64
aired_from_year float64

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

y_waiwai

2020/08/09 09:01

コードを提示しよう。 質問を編集し、<code>ボタンを押し、出てくる’’’の枠の中にコードを貼り付けてください
fran_fran

2020/08/09 09:07

ご指摘ありがとうございます。当方の理解不足でしたら恐れ入りますが、今回、mysqlワークベンチのTable Data Import Wizardから直接csvをインポートしたため、この作業において特にコードらしいものを書いておりません、、
y_waiwai

2020/08/09 09:10

ならどういう操作を行ったのか、どうやって取り込んだのか、を詳しい説明を追記すればどうでしょう あと、(あなたの考える)正しい結果というのはどういうもんなんでしょうか
can110

2020/08/09 09:52

特に問題なくインポートできました。 具体的に、どの行(anime_id)のどの列の値がどのようにおかしいのかを記載ください
guest

回答1

0

ベストアンサー

producer というカラムでは「TV Tokyo, AIC, Square Enix, Sotsu」といったデータになるところ

フィールドを囲む文字(ENCLOSED BY)の指定がされていなくて、カラム内の区切り文字(,)を拾ってしまい、ずれているんでしょう。

ワークベンチでどのように指定するかは分かりませんが、ウィザードではコマンドを編集しているだけでしょうから、コマンドが編集できるなら編集してみて下さい。

若しくは直接コマンド指定で行えば良いかと思います
以下参考
MySQLでCSVファイルを使って結果出力やデータ入力を行う方法

投稿2020/08/09 10:03

sazi

総合スコア25300

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.37%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問