質問編集履歴

日付をわかりやすいように表示

2020/11/16 02:22

投稿

XTJP

スコア11

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -1,3 +1,4 @@
+# 当初の質問
 ### 前提・実現したいこと
 書籍名から出版社名を得て、Googleスプレッドシートにまとめたいです。Colabで作業していますが、一旦csvにダウンロードして手動でスプレッドシートに貼り付けるのでも構いません。
@@ -22,7 +23,7 @@
 楽天ブックスのAPIもためしましたが、ISBNを使用する場合の方法だけがネット検索で見つかったので難儀しています。
-## 2020/11/16追記
+# 2020/11/16追記
 教えていただいた内容を反映してシートに転記するコードを書いたのですがまだうまく動きません。アドバイスを頂けると幸いです。
 ### 変更点
 - cellの内容のみを取得

7 86 125 179 1273

いただいたご指摘を反映しながらsheetに転記するコードを追記

2020/11/16 02:22

投稿

XTJP

スコア11

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -14,15 +14,39 @@
 などです。これらを｢夏目漱石｣とか｢人工知能｣とかに変更するとヒットしました。
 ### 該当のソースコード
+(文字数制限の都合上削除しました)
-```Python 3.6.9
-from google.colab import auth
-from oauth2client.client import GoogleCredentials
-import gspread
+### 試したこと
+[http://ailaby.com/ndl_search/](http://ailaby.com/ndl_search/)
+ほとんどこちらのサイトのコードそのままです。
-auth.authenticate_user()
-gc = gspread.authorize(GoogleCredentials.get_application_default())
+楽天ブックスのAPIもためしましたが、ISBNを使用する場合の方法だけがネット検索で見つかったので難儀しています。
+## 2020/11/16追記
+教えていただいた内容を反映してシートに転記するコードを書いたのですがまだうまく動きません。アドバイスを頂けると幸いです。
+### 変更点
+- cellの内容のみを取得
+- sheetに反映 のコードを自作
+- [このコードの作者さん](http://ailaby.com/ndl_search/)は1つの本に対して複数のデータを収集し、dfにまとめるものでしたが、私の場合は複数の本に対してそれぞれ1つのデータ(出版社名+あわよくば著者名など)を収集し、sheetにまとめたいので自分なりに編集しました。
+### 発生している問題・エラーメッセージ
+``` Python 3.6.9
+---------------------------------------------
+Search results for cnt=1 mediatype=1 title=そこが知りたかった　中毒診療 from=19800101
+---------------------------------------------
+---------------------------------------------------------------------------
+NameError                                 Traceback (most recent call last)
+<ipython-input-7-ed4b9090a8a1> in <module>()
+    109
+    110       #sheetに反映
+--> 111       worksheet.update_cell(cell.row, cell.col +1, publisher.text)
+    112       worksheet.update_cell(cell.row, cell.col +2, item.find('title').text)
+    113       worksheet.update_cell(cell.row, cell.col +3, author.text)
+NameError: name 'publisher' is not defined
+```
+### 該当のソースコード
+``` Python 3.6.9
 import numpy as np
 from pandas import DataFrame
 import xml.etree.ElementTree as ET
@@ -34,7 +58,7 @@
 workbook = gc.open_by_url(ss_url)
 worksheet = workbook.get_worksheet(1)
-cell_list = worksheet.range("A4:A5")
+cell_list = worksheet.range("A4:A10")
 for cell in cell_list:
   # 検索条件
@@ -42,7 +66,7 @@
   params['title']     = cell.value
   params['mediatype'] = '1'
   params['from']      = '1980-01-01'
-  params['cnt']       = '2'
+  params['cnt']       = '1'
   params['idx']       = '1'
   list_map = defaultdict(list)
@@ -54,7 +78,7 @@
   while True:
       # 検索リクエスト
-      r =  s.get('http://iss.ndl.go.jp/api/opensearch', params=str(params['title']))
+      r =  s.get('http://iss.ndl.go.jp/api/opensearch', params=params)
       # XML パース
       root = ET.fromstring(r.text.encode('utf-8'))
@@ -130,33 +154,32 @@
               print (' ' + publisher.text)
               list_map['publisher'].append(publisher.text)
           else:
-              list_map['publisher'].append('')
+              list_map['publisher'].append('不明')
+      #sheetに反映
+      worksheet.update_cell(cell.row, cell.col +1, publisher.text)
+      worksheet.update_cell(cell.row, cell.col +2, item.find('title').text)
+      worksheet.update_cell(cell.row, cell.col +3, author.text)
       cnt = int(params['cnt'])
       idx = int(params['idx'])
       if len(items) < cnt:
           break
+      # df = DataFrame({'title'       : list_map['title'],
+      #                'ID'          : list_map['ID'],
+      #                'author'      : list_map['author'],
+      #                'pubDate'     : list_map['pubDate'],
+      #                'issued'      : list_map['issued'],
+      #                'seriesTitle' : list_map['seriesTitle'],
+      #                'publisher'   : list_map['publisher']},
+      #                columns = ['title', 'ID', 'author', 'pubDate', 'issued', 'seriesTitle', 'publisher'])
+      # df.to_csv("books.csv", encoding='utf-8')
-      params['idx'] = str(idx + cnt)
+      # files.download('books.csv')
-      total += cnt
-      df = DataFrame({'title'       : list_map['title'],
-                      'ID'          : list_map['ID'],
-                      'author'      : list_map['author'],
-                      'pubDate'     : list_map['pubDate'],
-                      'issued'      : list_map['issued'],
-                      'seriesTitle' : list_map['seriesTitle'],
-                      'publisher'   : list_map['publisher']},
-                      columns = ['title', 'ID', 'author', 'pubDate', 'issued', 'seriesTitle', 'publisher'])
-      df.to_csv("books.csv", encoding='utf-8')
-      files.download('books.csv')
+      # df
-df
       #
-```
+```
-### 試したこと
-[http://ailaby.com/ndl_search/](http://ailaby.com/ndl_search/)
-ほとんどこちらのサイトのコードそのままです。
-楽天ブックスのAPIもためしましたが、ISBNを使用する場合の方法だけがネット検索で見つかったので難儀しています。

7 86 125 179 1273

gspreadでセルの情報まで引用していたのをセルの内容のみ引用するように変更→ params['title'] = cell.value

2020/11/16 02:21

投稿

XTJP

スコア11

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -39,7 +39,7 @@
   # 検索条件
   params = {}
-  params['title']     = cell
+  params['title']     = cell.value
   params['mediatype'] = '1'
   params['from']      = '1980-01-01'
   params['cnt']       = '2'

7 86 125 179 1273

URLをMarkdown記法に従って記載

2020/11/16 01:21

投稿

XTJP

スコア11

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -156,7 +156,7 @@
 ```
 ### 試したこと
-http://ailaby.com/ndl_search/
+[http://ailaby.com/ndl_search/](http://ailaby.com/ndl_search/)
 ほとんどこちらのサイトのコードそのままです。
 楽天ブックスのAPIもためしましたが、ISBNを使用する場合の方法だけがネット検索で見つかったので難儀しています。

7 86 125 179 1273