XMLのスクレイピングをGASでしてます
XmlからXmlServiceを使用して取得してスプレッドシートに保存できるコードを書いています
保存はできましたが重複した最後のテキストだけ保存され困っています。
XMLのスクレイピングをスプレッドシートに保存したい
最終はスプレッドシートにXMLデータを保存
することです。
下記の表のようにするのが目標です
ArticleCaption | ArticleTitle | ItemTitle | Sentence |
---|---|---|---|
(業務) | 第三条 | 司法書士は、この法律の定めるところにより、他人の依頼を受けて、次に掲げる事務を行うことを業とする。 | |
一 | 登記又は供託に関する手続について代理すること。 |
*ItemTitleなど、一号から数号まであります。
発生している問題
itemsentenceの部分などeachでループしたテキストが最後だけ保存されてしまいます。
該当のソースコード
function mFunction() { let url = 'https://elaws.e-gov.go.jp/api/1/lawdata/昭和二十五年法律第百九十七号'; let xml = UrlFetchApp.fetch(url).getContentText(); let document = XmlService.parse(xml); let root = document.getRootElement(); const applData = root.getChild("ApplData"); const lawFullText = applData.getChild("LawFullText"); const law = lawFullText.getChild("Law"); const lawBody = law.getChild("LawBody"); const mainProvision = lawBody.getChild("MainProvision"); const chapter = mainProvision.getChild("Chapter"); const articles = chapter.getChildren("Article"); articles.forEach(function(article){ var spreadsheet = SpreadsheetApp.openById('***************'); var sheet = spreadsheet.getSheetByName('*****'); var lastrow = sheet.getLastRow(); var recordrow = lastrow + 1; const articleCaption = article.getChild("ArticleCaption"); const articleTitle = article.getChild("ArticleTitle"); const paragraphs = article.getChildren("Paragraph"); sheet.getRange("A" + recordrow).setValue(articleCaption.getText()); sheet.getRange("B" + recordrow).setValue(articleTitle.getText()); if (paragraphs != null){ paragraphs.forEach(function(paragraph){ const paragraphNum = paragraph.getChild("ParagraphNum"); const paragraphSentence = paragraph.getChild("ParagraphSentence"); sheet.getRange("C" + recordrow).setValue(paragraphNum.getValue()); sheet.getRange("F" + recordrow).setValue(paragraphSentence.getValue()); const items = paragraph.getChildren("Item"); if (items !== null) { items.forEach(function (item) { const itemtitle = item.getChild("ItemTitle"); sheet.getRange("D" + recordrow).setValue(itemtitle.getText()); const itemSentence = item.getChild("ItemSentence"); sheet.getRange("F" + recordrow).setValue(itemSentence.getValue()); const columns = itemSentence.getChildren("Column"); if (columns !== null) { columns.forEach(function (column) { sheet.getRange("F" + recordrow).setValue(column.getText()); }) } const subitem1s = item.getChildren("Subitem1"); if (subitem1s !== null) { subitem1s.forEach(function (subitem1) { const subitem1Title = subitem1.getChild("Subitem1Title"); sheet.getRange("D" + recordrow).setValue(subitem1Title.getText()); const subitem1Sentences = subitem1.getChildren("Subitem1Sentence"); subitem1Sentences.forEach(function (subitem1Sentence) { sheet.getRange("F" + recordrow).setValue(subitem1Sentence.getValue()); }); const subitem2s = subitem1.getChildren("Subitem2"); if (subitem2s !== null) { subitem2s.forEach(function (subitem2) { const subitem2Title = subitem2.getChild("Subitem2Title"); sheet.getRange("D" + recordrow).setValue(subitem2Title.getText()); const subitem2Sentences = subitem2.getChildren("Subitem2Sentence"); subitem2Sentences.forEach(function (subitem2Sentence) { sheet.getRange("F" + recordrow).setValue(subitem2Sentence.getValue()); }); const subitem3s = subitem2.getChildren("Subitem3"); if (subitem3s !== null) { subitem3s.forEach(function (subitem3) { const subitem3Title = subitem3.getChild("Subitem3Title"); sheet.getRange("D" + recordrow).setValue(subitem3Title.getText()); const subitem3Sentences = subitem3.getChildren("Subitem3Sentence"); subitem3Sentences.forEach(function (subitem3Sentence) { sheet.getRange("F" + recordrow).setValue(subitem3Sentence.getValue()); }); }) } }) } }) } })} }) } }) }
試したこと
sentenceだけ取得してみましたが変わりませんでした。
consolelogでは全部取得できるのに
スプレッドシートに保存すると変わってしまいます。
解決法検索しましたが具体的に参考になりそうな方法が見つかりませんでした。
すみませんが解決のヒントなどお教えいただけないでしょうか。
回答1件
あなたの回答
tips
プレビュー