前提・実現したいこと
当方、Googleスプレッドシート使用初心者です。
Googleスプレッドシートでヤフーニュースのコメントリストの作成をしています。
A1に入力されたURLから、「投稿者名」「コメント内容」を取得する関数の作成中です。
「投稿者名」および「コメント内容」をIMPORTXMLで取得中にエラーメッセージが発生しました。
いくつかサイトを回ってみましたが、具体的な解決策が見つからず、
お力お貸しいただけますと幸いです。
◆取得元
https://headlines.yahoo.co.jp/cm/main?d=20191202-00000075-jij-cn&s=lost_points&o=desc&t=t&p=1
◆取得したXPath
▽ 投稿者名
//*[@id="authorcomment-15752772054970-4b44-18791"]/div/article/header/h1
▽コメント内容
//*[@id="authorcomment-15752772054970-4b44-18791"]/div/article/p
◆作成した関数
▽ 投稿者名
=IMPORTXML(A1,"[@class='name yjxName']")
▽コメント内容
=IMPORTXML(A1,"[@class='cmtBody']")
発生している問題・エラーメッセージ
インポートした XML コンテンツを解析できません。
該当のソースコード
▽ 投稿者名
<h1 class="name yjxName"><a href="https://news.yahoo.co.jp/profile/author/takahashikosuke/comments/" onclick="this.href='https://rdsig.yahoo.co.jp/_ylt=A2RmTCZzBuVdsCwAnRXrz_J7/RV=2/RE=1575376883/RH=cmRzaWcueWFob28uY28uanA-/RB=psPrInJ8R83Jz7wuLTdXosBvyDQ-/RU=aHR0cHM6Ly9uZXdzLnlhaG9vLmNvLmpwL3Byb2ZpbGUvYXV0aG9yL3Rha2FoYXNoaWtvc3VrZS9jb21tZW50cy8A/RK=0/RS=1IF_X0bSz5bbp3ASF5bRQ9nve1E-'" target="_parent" class="rapid-noclick-resp" data-rapid_p="1">高橋浩祐</a></h1>
▽コメント内容
<p class="comment yjxComment"> 中国政府は今年8月、アメリカ海軍の艦船2隻が予定していた香港への寄港を拒否している。今回の措置は、その延長線上にあるもので目新しさはない。今回何らかの制裁を受けることになったヒューマンライツ・ウォッチなどの国際的な人権団体は近年、新疆の「政治教育」収容所についての報告を発表するなど、中国政府との対立をぐっと深めてきた。<a href="javascript:void(0);" class="moreAthrCmtText" data-ylk="rsec:cmt_athr;slk:more;pos:1" data-rapid_p="5">...もっと見る</a><span class="hideAthrCmtText" style="display:none;"><br><br>総じて、今回の措置はいまさら感と手詰まり感がある。</span> </p>
試したこと
どこから手を付けてよいかわからず。
=IMPORTXML(A1,"[@class='name yjxName']")
に変えてみたりなど、初心者なりにいじくり回しましたが、さっぱりです。
あなたの回答
tips
プレビュー