"Python"で収集したデータを"csvファイル"にまとめたい

Question

### 前提・実現したいこと
初めまして。
Pythonの勉強を少し始めましたばかりなので色々と拙い説明になると思いますがご容赦ください。

Python を使用し、Twitterのデータを収集し、csvファイルにまとめようとしています。
様々なサイト様や書籍のおかげで、Twitterのデータを収集するまではできました。
問題はそれをcsvファイルにまとめるところです。

csvファイルに書き込みをすることはできたのですが…
1つのセルに1文字になったり、1つのセルに全て入ってしまったり、ごちゃごちゃになってしまいます。
自分ではこれ以上、分かりそうにないので、どなたか知恵をお貸し頂けないでしょうか。

---
理想
---
|ツイートID|投稿日|ユーザーID|投稿内容|
|:--|:--:|--:|
|ユーザー１のデータ|ユーザー1のデータ|ユーザー1のデータ|ユーザー1のデータ
|ユーザー2のデータ|ユーザー2のデータ|ユーザー2のデータ|ユーザー2のデータ

というように、ユーザー毎に行。データ毎に列を分けたいです。

### 発生している問題・エラーメッセージ

```
csvファイルに書き出しする際、予想と反した内容になってしまう。
例:
1つのセルに1文字(1045というデータの場合｢1｣｢0｣｢4｣｢5｣という様にセルが変わってしまいます)
1つのセルに全データ(各データ毎にセルを分けたいです)
ごちゃごちゃになってしまう(弄りすぎて変な所で改行されたりしています)

下記に個人的には一番上手くできた物を載せます
(1つのセルに1文字になってしまっていますが)
```

### 該当のソースコード

```Python
if __name__ == '__main__':
 
    # キーワードで取得
    getter = TweetsGetter.bySearch(u'検索キーワード')
    
    for tweet in getter.collect(total = 3):
       #標準モジュールcsvのインポート
        import csv 
    try:
        #書き込み　Shift_JIS
        with open('file.csv', 'w') as csvfile:
            writer = csv.writer(csvfile, lineterminator='
')
            writer.writerow(['ツイートID', '投稿日', 'ユーザーID', '内容'])
            writer.writerow('
')
            writer.writerow('{} {} {} {}'.format(tweet['id'], tweet['created_at'], '@'+tweet['user']['screen_name'],tweet['text']))
            writer.writerow('
')

            #起こりそうな例外のキャッチ
    except (FileNotFoundError) as e:
        print(e)
    except (csv.Error) as e:
        print(e)

```

### 試したこと

①
http://ailaby.com/twitter_api/
コチラを参考に、txtファイルでもやろうとしましたが、全て一列で並んだ形になってしまいます。
(txtファイルをExcelで読み込むつもりでやりました)

②
https://qiita.com/koara-local/items/0e56bc1e58b11e4d7a32
https://qiita.com/okadate/items/7b9620a5e64b4e906c42
pandas　という物が有効と情報を得たので、コチラを参考に色々と試してみました。
syntax error が出て混乱したので止めました。

### オマケ
時々、Twitterのデータを収集する際に文字が長いのか切れることがあります。
(Twitter上では 「私は今日、ご飯を食べた」なのに集めると「私は今日、ご飯を…」みたいに)
コードは①で上げた【http://ailaby.com/twitter_api/】とまるっきり同じなので
そういう仕様なのでしょうか?

現在の状況
---
umyu様、KojiDoi様、rinren様、LouiS0616様の助けを借り
・csvファイルではなく、txtファイルおよびtsvファイルで出力することに
・full_textを収集することに
→そのため、収集面は大丈夫になりました！ありがとうございます。

tsvファイルおよびtxtファイルを作成するところまで出来ました。
今度は、持ってきたfull_txtに改行コード等があることに気が付きました。
(Excelでインポートすると何かごちゃごちゃになるって言っていたのはコレが原因だったみたいです)

そのため、改行コードなどを消してしまうために"replace"を使おうと考えました。
中々上手くできないので、申し訳ありませんが、どなたかご教授頂けますと幸いです。

```Python
f.write(tweet['full_text'.replace('
', '')])
```
というように書いたのですが、やはりツイートデータ1つ1つに
改行などを削除する様にはできないのですか? 
今まで手に入った物は手作業でExcelに打ち込んでいたのですが…流石に数が多くて。

Accepted Answer

以下の部分ですが
```python
writer.writerow('{} {} {} {}'.format(tweet['id'], tweet['created_at'], '@'+tweet['user']['screen_name'],tweet['text']))
```

出力すべきデータをわざわざ単一の文字列にしてwriterowに渡しているのがまずいのではないでしょうか。画面に出力する仕様だった参照元のコード例を文脈を考えずにコピペしているのが敗因と思います。

必要なライブラリを持っていないので試していませんが、たぶん下のような感じではないでしょうか。

```python
writer.writerow([tweet['id'], tweet['created_at'], '@'+tweet['user']['screen_name'],tweet['text']])
```

あと、カンマ区切りの出力はあまりよろしくありません。本文（ツイート）が"10,000円の買い物をした"といった内容だったときにどうなるか考えてみてください。カンマをエスケープする手もありますが、区切り文字をタブにする（TSVファイルで出力する）のが、より簡単でしょう。

```
writer = csv.writer(csvfile, lineterminator='
', delimiter='	')
```

Answer

落ち穂拾いぽいの。

1,以下のインデントが正しいと仮定するとcsvには最終行のデータしか出力されません。
プログラムは上から下に実行するため、csvのヘッダー行を書き込んだ後、forループを回せば良いです。
```Python
    for tweet in getter.collect(total = 3):
       #標準モジュールcsvのインポート
        import csv 
    try:
```
2,ファイルの改行について
```Python
writer = csv.writer(csvfile, lineterminator='
')
```

csv.writerのlineterminatorオプションを指定しているため、writer.writerowは改行付きでファイル出力されます。
よって以下の改行を付与するコードは不要かと。

```Python
writer.writerow('
')
```

3,[FileNotFoundError](https://docs.python.jp/3/library/exceptions.html#FileNotFoundError)について

`with open('file.csv', 'w') as csvfile:`と'w'の書き込みモードでファイルを開いている(open)しているため、FileNotFoundErrorは発生しません。

```Python
    except (FileNotFoundError) as e:
        print(e)
```

4,オマケについて
> 時々、Twitterのデータを収集する際に文字が長いのか切れることがあります。

[140文字以上のツイートを取得する](https://qiita.com/hitsumabushi845/items/f7fd87106381fc65fc86)のリンク先に記載がありますが。
1,リクエストするエンドポイントが変わる。
2, status.textではなくstatus.full_textに変わる。

使用しているライブラリの.textを返す部分を確認してみてくださいな。


あとはtwitter APIとのやり取りは自作するより、
[python-twitter](https://github.com/bear/python-twitter) または [tweepy](https://github.com/tweepy/tweepy)のライブラリを使用する形の方がいいです。

---

2018/02/14追記

以下のコードだと'full_text'という文字列に対してreplaceを行っています。以下のように変更してください。
```Python
f.write(tweet['full_text'.replace('
', '')])
```

↓

```Python
f.write(tweet['full_text'].replace('
', ''))
```

分かりづらいなって思った時は作業変数を1個増やすとデバック確認が行いやすいです。
例えば以下のようなfull_text という変数を１個増やす形です。

```Python
full_text = tweet['full_text']
print(full_text)
print(full_text.replace('
', ''))
f.write(full_text.replace('
', ''))
```

前提・実現したいこと

理想

発生している問題・エラーメッセージ

該当のソースコード

試したこと

オマケ

現在の状況

関連した質問