質問するログイン新規登録
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Q&A

解決済

1回答

490閲覧

Pyhtonで datasets ライブラリー取得のエラー

teefpc

総合スコア112

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

0グッド

0クリップ

投稿2024/05/20 07:48

編集2024/05/21 13:49

0

0

実現したいこと

環境: Ubuntu 24.04 (単独のLinux専用機で、Windowsから立ち上げたものではありません)
言語: Python 3.8

Linux

1pip install datasets

Python

1from datasets import load_dataset 2ds = load_dataset('globis-university/aozorabunko-clean')

をローカルマシンの Python3.8 で実行したい。

発生している問題・分からないこと

最初、のエラーは、

Python

1 load_dataset('globis-university/aozorabunko-clean')

の行で、

Python

1ValueError: Invalid pattern: '**' can only be an entire path component

とでましたが、何度もバージョンを変えたり、condaコマンドなども使って datasetsをインストールしなおしていると、

Python

1from datasets import load_dataset

の行で、

Python

1AttributeError: module 'pyarrow' has no attribute '__version__'

というエラーが出るようになりました。
Google Colaboratory で試してみると問題ありませんでした。
最初のエラーの再現もできません。解決策を教えてください。

該当のソースコード

Ubuntu22.04

Linux

1pip install datasets

を実行。
Python 3.8

Python

1from datasets import load_dataset 2ds = load_dataset('globis-university/aozorabunko-clean')

を実行。

試したこと・調べたこと

  • teratailやGoogle等で検索した
  • ソースコードを自分なりに変更した
  • 知人に聞いた
  • その他
上記の詳細・結果

Linux

1pip install datasets 2pip install datasets==2.10.1 3pip install -U datasets 4conda install datasets 5```などです。 6 7### 補足 8特になし

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

meg_

2024/05/21 00:03

> とでましたが、何度もバージョンを変えたり、condaコマンドなども使って datasetsをインストールしなおしていると、 同一Python環境へのpipとcondaの併用は非推奨ですがそこは問題ないでしょうか?
teefpc

2024/05/21 13:54

conda との併用は、まずかったと思います。
teefpc

2024/05/21 13:58 編集

Python 3.10で同様の処理を行うと動きました。バージョンの違いからかもしれません。 もしPython3.8で動いている方がいらっしゃれば、datasetsのバージョンを教えて下さい。
melian

2024/05/21 14:11 編集

先週、GitHub のリポジトリに同様の issue の報告がありました。 Invalid pattern: '**' can only be an entire path component · Issue #6737 · huggingface/datasets https://github.com/huggingface/datasets/issues/6737 fsspec パッケージが古いため、最新版にアップデートすることで修正できるとのことです。ただ、Python3.8 で有効なのかどうかは不明です。 pip install -U fsspec
teefpc

2024/05/23 00:57

ありがとうございます。試してみます。
teefpc

2024/05/28 13:41

不思議です。Python 3.8 の環境で、 ```Shell Script pip install datasets ``` ```Python3.8 from datasets import load_dataset ds = load_dataset('globis-university/aozorabunko-clean') ``` を実行できるようになっていました。Hugging Faceのファイルの更新は昨年ですので、こちらの環境の問題であった可能性が高いです。 いろいろご指南してくださり、どうもありがとうございました。
guest

回答1

0

自己解決

新規作成したPython 3.8 の環境で、

Shell

1pip install datasets

Python3.8

1from datasets import load_dataset 2ds = load_dataset('globis-university/aozorabunko-clean')

を実行できるようになっていました。

投稿2024/05/28 13:43

teefpc

総合スコア112

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.30%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問