回答編集履歴
1
追記
test
CHANGED
@@ -23,3 +23,73 @@
|
|
23
23
|
一応、「同一内容を複数アカウントでツイート」のように、Twitterが"しないで"と明に言っている行為には該当してはいないと思います。
|
24
24
|
|
25
25
|
しかしながら同一IPからの多重アクセスといった行為にどのような監視をしているのかはわからないので、"リスクなどは自分自身で判断する"必要があると思います。
|
26
|
+
|
27
|
+
|
28
|
+
|
29
|
+
----
|
30
|
+
|
31
|
+
|
32
|
+
|
33
|
+
(追記)
|
34
|
+
|
35
|
+
すみません。コードを読み違えました。
|
36
|
+
|
37
|
+
`api.get_user(followerID)`の部分でrate_limitが回復するまで待たされる方が、時間がかかる主な原因でしょうね。ピントがずれた回答になってしまいました。
|
38
|
+
|
39
|
+
(rate_limit制限の分待たされるしそれを回避するのは無理、という結論が変わることはありませんが)
|
40
|
+
|
41
|
+
|
42
|
+
|
43
|
+
さて、5000件を超えるフォロワーの取得ですが
|
44
|
+
|
45
|
+
|
46
|
+
|
47
|
+
[https://docs.tweepy.org/en/v3.5.0/cursor_tutorial.html](https://docs.tweepy.org/en/v3.5.0/cursor_tutorial.html)
|
48
|
+
|
49
|
+
|
50
|
+
|
51
|
+
で解説されているCursorという機能がtweepyに用意されています。
|
52
|
+
|
53
|
+
|
54
|
+
|
55
|
+
```python
|
56
|
+
|
57
|
+
followerIDs = api.followers_ids("ユーザーID")
|
58
|
+
|
59
|
+
|
60
|
+
|
61
|
+
followerDatas = []
|
62
|
+
|
63
|
+
for followerID in followerIDs:
|
64
|
+
|
65
|
+
...
|
66
|
+
|
67
|
+
```
|
68
|
+
|
69
|
+
の部分を
|
70
|
+
|
71
|
+
```python
|
72
|
+
|
73
|
+
followerIDs = tweepy.Cursor(api.followers_ids, "ユーザーID")
|
74
|
+
|
75
|
+
|
76
|
+
|
77
|
+
followerDatas = []
|
78
|
+
|
79
|
+
for page in followerIDs.pages():
|
80
|
+
|
81
|
+
for followerID in page:
|
82
|
+
|
83
|
+
...
|
84
|
+
|
85
|
+
```
|
86
|
+
|
87
|
+
とすることで可能です。
|
88
|
+
|
89
|
+
followers/ids API が rate_limit制限に引っかかると、`followerIDs.pages()`がウェイトで待たされます。そこは元の回答の通りです。
|
90
|
+
|
91
|
+
|
92
|
+
|
93
|
+
followers/ids API の rate_limit制限と users/show API の rate_limit制限は別々で、
|
94
|
+
|
95
|
+
users/show APIの方が回復が遅いので、followers/ids の実行効率がよくないでしょう。
|