求められているものが何なのかが良くわかりませんが、以下のようなことをすれば中身は取り出せます。
python
1>>> import tarfile
2>>> tar = tarfile.open(name='stair_captions_v1.2.tar.gz', mode='r')
3>>> infos = tar.getmembers()
4>>> print(infos[1].name)
5stair_captions_v1.2_train_tokenized.json
6>>> with tar.extractfile(infos[1]) as f:
7... txt = f.read().decode()
8...
9>>> print(txt[41122000:41123000])
10電話 で 話 を し て いる", "id": 291776, "caption": "黒い髪の女性が、携帯電話で話をしている"}, {"image_id": 335824, "tokenized_caption": "4 人 の 男性 が 、 スキー で 滑っ て いる", "id": 291781, "caption": "4人の男性が、スキーで滑ってい る"}, {"image_id": 16169, "tokenized_caption": "トレンチコート を 着 た 男性 が 凧 を 抱え て いる", "id": 291782, "caption": "トレンチコートを着た男性が凧を抱えている"}, {"image_id": 297919, "tokenized_caption": "青 の 水着 を 着 た 男性 が セイ リング を し て いる", "id": 291783, "caption": "青の水着を着た男性がセイリングをしている"}, {"image_id": 149117, "tokenized_caption": "像 が ピンク色 の おもちゃ で 遊ん で いる", "id": 291788, "caption": "像がピンク色のおもちゃで遊んでいる"}, {"image_id": 291827, "tokenized_caption": "白い サーフ ボード を 持っ た 男性 が 浅瀬 に 立っ て いる", "id": 291790, "caption": "白いサーフボードを持った男性が浅瀬に立っている"}, {"image_id": 186247, "tokenized_caption": "サンドイッチ に つま ようじ が 1 本 刺さっ て いる", "id": 291793, "caption": "サンドイッチにつまようじが1本刺さっている"}, {"image_id": 35423, "tokenized_caption": "パソコン の 上 の 棚 に モデム が 4 つ 置い て ある", "id": 291794, "caption": "パソコンの上の棚にモデムが4つ置いてある"}, {"image_id": 222964, "tokenized_caption": "ソファー の 上 に パ
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2021/10/06 00:20
2021/10/06 01:46