質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.31%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

Q&A

解決済

1回答

1894閲覧

savファイルのよみこみが上手くできません

ika03600002

総合スコア1

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

0グッド

0クリップ

投稿2022/12/16 03:18

前提

pyhonでGEMのdatasets(https://www.gemconsortium.org/data/sets?id=aps)
を用いて卒論に活かしたいと考えています。

実現したいこと

データの入ったsavファイルをcsvファイルに変えて読み込み、dataframeにしたい。

発生している問題・エラーメッセージ

ReadstatError: Unable to convert string to the requested encoding (invalid byte sequence)

該当のソースコード

python

1import pandas as pd 2df = pd.read_spss("../data/GEM 2018 APS Global Individual Level Data.sav")

試したこと

エクセルやatomでファイルを開いてみても文字化けで見えませんでした。

補足情報(FW/ツールのバージョンなど)

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

Error when reading a SPSS file that is in Spanish with Pandas (Python)に記載があるとおり、pyreadstatを直接利用してエンコーディングを明示的に指定する必要があるようです。
なお、中身のデータが正しい(文字化けなどしていない)かは確認していません。

Python

1import pyreadstat 2df, meta = pyreadstat.read_sav('GEM 2018 APS Global Individual Level Data.sav', encoding='latin1') 3print(df) 4""" 5 country ctryalp REGION WEFInc ... IPACTLD_ALL IPACTLD_EMP IPACTLDNOW_ALL IPACTLDNOW_EMP 60 1.0 US 5.0 4.0 ... 0.0 0.0 0.0 0.0 71 1.0 US 5.0 4.0 ... 0.0 0.0 0.0 0.0 82 1.0 US 5.0 4.0 ... 0.0 0.0 0.0 0.0 93 1.0 US 5.0 4.0 ... 0.0 0.0 0.0 0.0 104 1.0 US 5.0 4.0 ... 0.0 0.0 0.0 0.0 11... ... ... ... ... ... ... ... ... ... 12162072 974.0 QA 2.0 4.0 ... 0.0 NaN 0.0 NaN 13162073 974.0 QA 2.0 4.0 ... 0.0 0.0 0.0 0.0 14162074 974.0 QA 2.0 4.0 ... 0.0 0.0 0.0 0.0 15162075 974.0 QA 2.0 4.0 ... 1.0 1.0 0.0 0.0 16162076 974.0 QA 2.0 4.0 ... 0.0 0.0 0.0 0.0 17 18[162077 rows x 281 columns] 19"""

投稿2022/12/16 04:27

can110

総合スコア38352

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

ika03600002

2022/12/16 21:51

本当に助かりました!!!!!!!これで卒論を進められそうです。ありがとうございます!!
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.31%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問