質問編集履歴

11

a

2022/10/23 21:28

投稿

spoofy_dragon
spoofy_dragon

スコア1248

test CHANGED
@@ -1 +1 @@
1
- _xxxxxxxxxxxx_
1
+ a
test CHANGED
@@ -1 +1 @@
1
- _xxxxxxxxxx_xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
1
+ a

10

ssssssssssssssssssssssssssssssss

2022/10/23 21:10

投稿

spoofy_dragon
spoofy_dragon

スコア1248

test CHANGED
File without changes
test CHANGED
File without changes

9

xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx

2022/10/23 21:08

投稿

spoofy_dragon
spoofy_dragon

スコア1248

test CHANGED
@@ -1 +1 @@
1
- Twitterのクローリング,スクレイピングについて
1
+ _xxxxxxxxxxxx_
test CHANGED
@@ -1,87 +1 @@
1
- ### Twitterの利用規約 (2019年12月2日時点)
2
-
3
- Twitterの利用規約の解釈について知りたいです.答えではなく特に**皆さんの意見をお聞きしたいです.**以下,[Twitterの利用規約4-(iii)](https://twitter.com/ja/tos)の抜粋
4
-
5
- > Twitterから提供される(かつ該当する利用条件に従う場合にのみ提供される)、当社の現在利用可能な公開インターフェース以外の方法(自動プログラムか否かを問わない)で、本サービスへのアクセスもしくはその探索またはアクセスもしくは探索の試み(ただし、Twitterとの個別契約で特に許可されている場合は除く)(注:本サービスへのクローリングは、robots.txtファイルの定めによる場合は認められていますが、Twitterによる事前の同意がないまま本サービスのスクレイピングをすることは明示的に禁止されています)、
6
-
7
-
8
-
9
- ここにおけるクローリングとスクレイピングについて,下記に示す例は規約違反になるかどうかを知りたいです.
10
-
11
- 私のクローリングとスクレイピングの理解は[このstackoverflowの記事](https://stackoverflow.com/questions/4327392/what-is-the-difference-between-web-crawling-and-web-scraping) の2番目の回答と同じです.また,twitterの[robots.txt](https://twitter.com/robots.txt)にも目を通しています.
12
-
13
-
14
-
15
-
16
-
17
- ### これらは違反になるのか? 可能なら理由を添えて答えていただけると嬉しいです.
18
-
19
- 1. ウェブブラウザで`https://twitter.com/誰かのアカウント?lang=ja`にアクセスする.
20
-
21
-
22
-
23
- 1. ウェブブラウザで`https://twitter.com/誰かのアカウント?lang=ja`にアクセスした後,ページを保存する(Chromeの場合,Ctrl-S).
24
-
25
-
26
-
27
- 1. Terminalから手動で`curl https://twitter.com/誰かのアカウント?lang=ja`を実行する.
28
-
29
-
30
-
31
- 1. Terminalから手動で`curl https://twitter.com/誰かのアカウント?lang=ja > out.txt`を実行し,htmlをテキストファイルに保存する.
32
-
33
-
34
-
35
- 1. `curl https://twitter.com/誰かのアカウント?lang=ja >> out.txt` を`cron`などで(1秒以上間隔を開けて)定期的に実行する.
36
-
37
-
38
-
39
- 1. Pythonのライブラリの`requests`から`https://twitter.com/誰かのアカウント?lang=ja`に定期的にHTTP GETリクエストを送り,得られたhtmlをデータベースに保存する.
40
-
41
-
42
-
43
- 1. Pythonのライブラリの`selenium`から`https://twitter.com/誰かのアカウント?lang=ja`に定期的にHTTP GETリクエストを送り,得られたhtmlをデータベースに保存する.
44
-
45
-
46
-
47
- 1. 6, 7のプログラム終了した後,データベースに保存したhtmlからYoutubeリンクのURLだけを抜きとり,その文字列を別のデータベースに保存する.
48
-
49
-
50
-
51
- 1. 6, 7のプログラムを実行しながら,データベースに保存したhtmlからYoutubeリンクのURLだけを抜きとり,その文字列を別のデータベースに保存する.
52
-
53
-
54
-
55
- 1. Pythonのライブラリの`requests`から`https://twitter.com/誰かのアカウント?lang=ja`に定期的にHTTP GETリクエストを送り,得られたhtmlからYoutubeリンクのURLだけを抜きとり,その文字列をデータベースに保存する.
56
-
57
-
58
-
59
- 1. Pythonのライブラリの`selenium`から`https://twitter.com/誰かのアカウント?lang=ja`に定期的にHTTP GETリクエストを送り,得られたhtmlからYoutubeリンクのURLだけを抜きとり,その文字列をデータベースに保存する.
60
-
61
-
62
-
63
- ### おわりに
64
-
65
- 雑多な質問で恐縮ですが,お答えいただけると幸いです.
66
-
67
- ちなみに,上記の1.以外はいずれもまだ実行していません.
68
-
69
- ~~私は全てやっても大丈夫だと思います.~~
70
-
71
- 退会済みユーザ様の回答にもあるとおり,やはり規約的にスクレイピングは厳しそうですね.
72
-
73
- とりあえず,1. は問題ないでしょう.2.はブラウザの機能を使うのでおそらく問題ないのではと思います.その他は一見ダメそうですが,Twitterが想定している方法がブラウザからのアクセスだとすると,`selenium`からのアクセスはどうなるのでしょうか?
74
-
75
-
76
-
77
- - 私は法律や規約に関しては詳しくないので,ここで質問させていただきました.回答の根拠となるソースを教えていただけましたら,この上なくありがたいですが,お気軽に回答してください.
78
-
79
- - Twitter APIを使えという回答はごもっともですのでご遠慮ください.
80
-
81
- - 一部に対してだけでも良いのでご回答いただけると嬉しいです.
82
-
83
- - ~~Twitterに確認するのが最も適切な解決方法であることは重々承知しておりますが,[Twitterの問い合わせフォーム](https://help.twitter.com/forms)を一読したところ,私の質問に対応したものがないと思ったので,こちらで質問させていただきました.もし,適切な確認先(具体的な質問フォーム,メールアドレスなどの連絡先)をご存知でしたらご教授いただきたいです.~~
84
-
85
- - 申し訳ありません.[公式フォーラム](https://twittercommunity.com/)が適切な問い合わせ先でした.こちらに問い合わせてみますが,**有識な皆様のご意見をお聞きしたい**ので,公式からの返答がない間は未解決としておきます.
86
-
87
- - **無論やらないに越したことはありません.**
1
+ _xxxxxxxxxx_xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx

8

意見の更新

2019/12/06 18:26

投稿

spoofy_dragon
spoofy_dragon

スコア1248

test CHANGED
File without changes
test CHANGED
@@ -1,8 +1,6 @@
1
1
  ### Twitterの利用規約 (2019年12月2日時点)
2
2
 
3
- Twitterの利用規約の解釈について知りたいです.
4
-
5
- 以下,[Twitterの利用規約4-(iii)](https://twitter.com/ja/tos)の抜粋
3
+ Twitterの利用規約の解釈について知りたいです.答えではなく特に**皆さんの意見をお聞きしたいです.**以下,[Twitterの利用規約4-(iii)](https://twitter.com/ja/tos)の抜粋
6
4
 
7
5
  > Twitterから提供される(かつ該当する利用条件に従う場合にのみ提供される)、当社の現在利用可能な公開インターフェース以外の方法(自動プログラムか否かを問わない)で、本サービスへのアクセスもしくはその探索またはアクセスもしくは探索の試み(ただし、Twitterとの個別契約で特に許可されている場合は除く)(注:本サービスへのクローリングは、robots.txtファイルの定めによる場合は認められていますが、Twitterによる事前の同意がないまま本サービスのスクレイピングをすることは明示的に禁止されています)、
8
6
 
@@ -68,7 +66,11 @@
68
66
 
69
67
  ちなみに,上記の1.以外はいずれもまだ実行していません.
70
68
 
71
- 私は全てやっても大丈夫だと思います.
69
+ ~~私は全てやっても大丈夫だと思います.~~
70
+
71
+ 退会済みユーザ様の回答にもあるとおり,やはり規約的にスクレイピングは厳しそうですね.
72
+
73
+ とりあえず,1. は問題ないでしょう.2.はブラウザの機能を使うのでおそらく問題ないのではと思います.その他は一見ダメそうですが,Twitterが想定している方法がブラウザからのアクセスだとすると,`selenium`からのアクセスはどうなるのでしょうか?
72
74
 
73
75
 
74
76
 
@@ -81,3 +83,5 @@
81
83
  - ~~Twitterに確認するのが最も適切な解決方法であることは重々承知しておりますが,[Twitterの問い合わせフォーム](https://help.twitter.com/forms)を一読したところ,私の質問に対応したものがないと思ったので,こちらで質問させていただきました.もし,適切な確認先(具体的な質問フォーム,メールアドレスなどの連絡先)をご存知でしたらご教授いただきたいです.~~
82
84
 
83
85
  - 申し訳ありません.[公式フォーラム](https://twittercommunity.com/)が適切な問い合わせ先でした.こちらに問い合わせてみますが,**有識な皆様のご意見をお聞きしたい**ので,公式からの返答がない間は未解決としておきます.
86
+
87
+ - **無論やらないに越したことはありません.**

7

意見を追記

2019/12/06 18:26

投稿

spoofy_dragon
spoofy_dragon

スコア1248

test CHANGED
File without changes
test CHANGED
@@ -68,6 +68,8 @@
68
68
 
69
69
  ちなみに,上記の1.以外はいずれもまだ実行していません.
70
70
 
71
+ 私は全てやっても大丈夫だと思います.
72
+
71
73
 
72
74
 
73
75
  - 私は法律や規約に関しては詳しくないので,ここで質問させていただきました.回答の根拠となるソースを教えていただけましたら,この上なくありがたいですが,お気軽に回答してください.
@@ -78,4 +80,4 @@
78
80
 
79
81
  - ~~Twitterに確認するのが最も適切な解決方法であることは重々承知しておりますが,[Twitterの問い合わせフォーム](https://help.twitter.com/forms)を一読したところ,私の質問に対応したものがないと思ったので,こちらで質問させていただきました.もし,適切な確認先(具体的な質問フォーム,メールアドレスなどの連絡先)をご存知でしたらご教授いただきたいです.~~
80
82
 
81
- - 申し訳ありません.[公式フォーラム](https://twittercommunity.com/)が適切な問い合わせ先でした.こちらに問い合わせてみますが,有識な皆様のご意見お聞きしたいので,公式からの返答がない間は未解決としておきます.
83
+ - 申し訳ありません.[公式フォーラム](https://twittercommunity.com/)が適切な問い合わせ先でした.こちらに問い合わせてみますが,**有識な皆様のご意見お聞きしたい**ので,公式からの返答がない間は未解決としておきます.

6

公式フォーラムについて追記

2019/12/02 14:44

投稿

spoofy_dragon
spoofy_dragon

スコア1248

test CHANGED
File without changes
test CHANGED
@@ -76,4 +76,6 @@
76
76
 
77
77
  - 一部に対してだけでも良いのでご回答いただけると嬉しいです.
78
78
 
79
- - Twitterに確認するのが最も適切な解決方法であることは重々承知しておりますが,[Twitterの問い合わせフォーム](https://help.twitter.com/forms)を一読したところ,私の質問に対応したものがないと思ったので,こちらで質問させていただきました.もし,適切な確認先(具体的な質問フォーム,メールアドレスなどの連絡先)をご存知でしたらご教授いただきたいです.
79
+ - ~~Twitterに確認するのが最も適切な解決方法であることは重々承知しておりますが,[Twitterの問い合わせフォーム](https://help.twitter.com/forms)を一読したところ,私の質問に対応したものがないと思ったので,こちらで質問させていただきました.もし,適切な確認先(具体的な質問フォーム,メールアドレスなどの連絡先)をご存知でしたらご教授いただきたいです.~~
80
+
81
+ - 申し訳ありません.[公式フォーラム](https://twittercommunity.com/)が適切な問い合わせ先でした.こちらに問い合わせてみますが,有識な皆様のご意見もお聞きしたいので,公式からの返答がない間は未解決としておきます.

5

マルチポストに関するものを削除

2019/12/02 09:13

投稿

spoofy_dragon
spoofy_dragon

スコア1248

test CHANGED
File without changes
test CHANGED
@@ -76,4 +76,4 @@
76
76
 
77
77
  - 一部に対してだけでも良いのでご回答いただけると嬉しいです.
78
78
 
79
- - Twitterに確認するのが最も適切な解決方法であることは重々承知しておりますが,[Twitterの問い合わせフォーム](https://help.twitter.com/forms)を一読したところ,私の質問に対応したものがないと思ったので,こちらで質問させていただきました.もし,適切な確認先(具体的な質問フォーム,メールアドレスなどの連絡先)をご存知でしたらご教授いただきたいです. また,これは法律,規約に関する質問ですので,法律系のQ&Aサイトにも同様の質問をいたしました.
79
+ - Twitterに確認するのが最も適切な解決方法であることは重々承知しておりますが,[Twitterの問い合わせフォーム](https://help.twitter.com/forms)を一読したところ,私の質問に対応したものがないと思ったので,こちらで質問させていただきました.もし,適切な確認先(具体的な質問フォーム,メールアドレスなどの連絡先)をご存知でしたらご教授いただきたいです.

4

追記

2019/12/02 08:12

投稿

spoofy_dragon
spoofy_dragon

スコア1248

test CHANGED
File without changes
test CHANGED
@@ -75,3 +75,5 @@
75
75
  - Twitter APIを使えという回答はごもっともですのでご遠慮ください.
76
76
 
77
77
  - 一部に対してだけでも良いのでご回答いただけると嬉しいです.
78
+
79
+ - Twitterに確認するのが最も適切な解決方法であることは重々承知しておりますが,[Twitterの問い合わせフォーム](https://help.twitter.com/forms)を一読したところ,私の質問に対応したものがないと思ったので,こちらで質問させていただきました.もし,適切な確認先(具体的な質問フォーム,メールアドレスなどの連絡先)をご存知でしたらご教授いただきたいです. また,これは法律,規約に関する質問ですので,法律系のQ&Aサイトにも同様の質問をいたしました.

3

曖昧な表現の修正

2019/12/02 06:55

投稿

spoofy_dragon
spoofy_dragon

スコア1248

test CHANGED
File without changes
test CHANGED
@@ -66,10 +66,12 @@
66
66
 
67
67
  雑多な質問で恐縮ですが,お答えいただけると幸いです.
68
68
 
69
- ちなみにまだ,上記の1.以外はいずれもまだ実行していません.
69
+ ちなみに,上記の1.以外はいずれもまだ実行していません.
70
70
 
71
71
 
72
72
 
73
- - 私は法律や規約に関しては詳しくないので,ここで質問させていただきました.回答の根拠となるソースを教えていただけましたら,この上なくありがたいです.ですが,お気軽に回答してください.
73
+ - 私は法律や規約に関しては詳しくないので,ここで質問させていただきました.回答の根拠となるソースを教えていただけましたら,この上なくありがたいですが,お気軽に回答してください.
74
74
 
75
75
  - Twitter APIを使えという回答はごもっともですのでご遠慮ください.
76
+
77
+ - 一部に対してだけでも良いのでご回答いただけると嬉しいです.

2

曖昧な表現の訂正

2019/12/02 05:57

投稿

spoofy_dragon
spoofy_dragon

スコア1248

test CHANGED
File without changes
test CHANGED
@@ -54,11 +54,11 @@
54
54
 
55
55
 
56
56
 
57
- 1. Pythonのライブラリの`requests`から`https://twitter.com/誰かのアカウント?lang=ja`に定期的にHTTP GETリクエストを送り,得られたhtmlからYoutubeリンクのURLだけを抜きとり,その文字列を別のデータベースに保存する.
57
+ 1. Pythonのライブラリの`requests`から`https://twitter.com/誰かのアカウント?lang=ja`に定期的にHTTP GETリクエストを送り,得られたhtmlからYoutubeリンクのURLだけを抜きとり,その文字列をデータベースに保存する.
58
58
 
59
59
 
60
60
 
61
- 1. Pythonのライブラリの`selenium`から`https://twitter.com/誰かのアカウント?lang=ja`に定期的にHTTP GETリクエストを送り,得られたhtmlからYoutubeリンクのURLだけを抜きとり,その文字列を別のデータベースに保存する.
61
+ 1. Pythonのライブラリの`selenium`から`https://twitter.com/誰かのアカウント?lang=ja`に定期的にHTTP GETリクエストを送り,得られたhtmlからYoutubeリンクのURLだけを抜きとり,その文字列をデータベースに保存する.
62
62
 
63
63
 
64
64
 

1

最後に追記

2019/12/02 05:16

投稿

spoofy_dragon
spoofy_dragon

スコア1248

test CHANGED
File without changes
test CHANGED
@@ -66,4 +66,10 @@
66
66
 
67
67
  雑多な質問で恐縮ですが,お答えいただけると幸いです.
68
68
 
69
- ちなみにまだ,上記の1.以外はいずれもまだ実行していません
69
+ ちなみにまだ,上記の1.以外はいずれもまだ実行していません
70
+
71
+
72
+
73
+ - 私は法律や規約に関しては詳しくないので,ここで質問させていただきました.回答の根拠となるソースを教えていただけましたら,この上なくありがたいです.ですが,お気軽に回答してください.
74
+
75
+ - Twitter APIを使えという回答はごもっともですのでご遠慮ください.