質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

89.53%

Python3系でtsvファイルのヘッダー部分を削除したい

解決済

回答 2

投稿

  • 評価
  • クリップ 0
  • VIEW 85

amaturePy

score 73

Python3系でtsvファイルの中身を読み込んで、キーの値である飲食店名を出力したいです。
そこでtsv内データを辞書型にする際にヘッダー部分(NAME    COUNT)まで入ってしまいます。
できればここを抜きたいのですが、うまく行きません。
アドバイス頂けたら幸いです。
【tsvファイル】

NAME    COUNT
吉野家    3
バーミヤン    2
すき家    1
松屋    1
ラーメン屋    1
無回答    1

【対応したこと】
nextメソッドを実行

import csv

#name = input("What's your name?")
file0 = "/Users/apple/Downloads/practice.tsv"
datas = []
with open(file0, mode="r", encoding="utf-8") as f:
    reader = next(csv.DictReader(f))
    for i in reader:
        #keys = i.keys()
        datas.append(i)
print(datas)

実行結果
['NAME\tCOUNT']


【現状のコード】

import csv

#name = input("What's your name?")
file0 = "/Users/apple/Downloads/practice.tsv"
datas = []
with open(file0, mode="r", encoding="utf-8") as f:
    reader = csv.DictReader(f)
    for i in reader:
        #keys = i.keys()
        datas.append(i)
print(datas)

実行結果
[OrderedDict([('NAME\tCOUNT', '吉野家\t3')]), 
OrderedDict([('NAME\tCOUNT', 'バーミヤン\t2')]), 
OrderedDict([('NAME\tCOUNT', 'すき家\t1')]), 
OrderedDict([('NAME\tCOUNT', '松屋\t1')]), 
OrderedDict([('NAME\tCOUNT', 'ラーメン屋\t1')]), 
OrderedDict([('NAME\tCOUNT', '無回答\t1')])]
​
  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 過去に投稿した質問と同じ内容の質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 2

checkベストアンサー

+1

TSVファイルをdict型にしたいだけならば、pandas 使うと簡単にできます。

import pandas as pd
d = pd.read_table('data.tsv', index_col='NAME').to_dict()['COUNT']

print(d)
#{'吉野家': 3, 'バーミヤン': 2, 'すき家': 1, '松屋': 1, 'ラーメン屋': 1, '無回答': 1}

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2020/03/26 20:59

    ありがとうございます!
    pandasを使うと
    こんなに短いコードで実現できるのですね。

    キャンセル

+1

TSVの読み込み (csv.DictReaderの場合)

csvモジュールでの区切り文字はカンマなので、
tsvの場合はdelimiterにタブを指定します。

reader = csv.DictReader(f, delimiter="\t")
for row in reader:
    print(row["NAME"], row["COUNT"])

ヘッダ行を読み飛ばす (next() -> csv.reader)

next(f) # ファイルの1行目を読み飛ばしてから、こちらでは csv.reader を使う
reader = csv.reader(f, delimiter="\t")
for name, count in reader:
    print(name, count)

辞書へ変換 (column長が2の場合のみ)

next(f)
data = dict(csv.reader(f, delimiter="\t"))
print(data)
{'無回答': '1', '松屋': '1', 'ラーメン屋': '1',
 'バーミヤン': '2', '吉野家': '3', 'すき家': '1'}

count値を文字列ではなく数値型にする場合は

next(f)
data = dict((name, int(count)) for name, count in csv.reader(f, delimiter="\t"))

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2020/03/26 20:59

    ありがとうございます!
    とても参考になりました!
    読み込みから辞書への変換まで一連のコードを真似して見ます!

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 89.53%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる