前提・実現したいこと
下記のサイトからテキストをスクレイピングしたいです。
https://www.ldoceonline.com/dictionary/time
取得したいテキストは画像の部分なのですが、spanタグの中にaタグが紛れている単語があり、セルが分裂してしまいます。
同じセルに入れたいのですが何か方法はございませんか?
ーーー追記ーーー
1のみではなく、2、3、4とある場合はそれも取得したいです。
発生している問題・エラーメッセージ
セルがaタグで分裂してしまう。
該当のソースコード
A2にはtimeが入っております。
=ImportXML("https://www.ldoceonline.com/dictionary/"&A2,"//*[@class='dictionary']/*[@class='dictentry'][1]//*[@class='Sense']/span[5]")
取得したい部分のhtmlはこのような感じです。
clocksもthe thing~と同じセルに入力したいです。
<span class="DEF"> the thing that is measured in minutes, hours, days, years etc using <a class="defRef" title="clock" href="/dictionary/clock">clocks</a></span>
取得できているのはこのような感じです。
今回のページはタグで挟まれているのは1つなのですが、別単語の時は何個か挟まれている場合がございます。
試したこと
ーーー追記ーーー
=CONCATENATE(ImportXML("https://www.ldoceonline.com/dictionary/"&A2,"//*[@class='dictionary']/*[@class='dictentry'][1]//*[@class='Sense']/span[@class='DEF']"))
= TEXTJOIN(",",FALSE, ImportXML("https://www.ldoceonline.com/dictionary/"&A2,"//*[@class='dictionary']/*[@class='dictentry'][1]//*[@class='Sense']/span[@class='DEF']"))
これも試していますが、上の画像と同じになります
補足情報(FW/ツールのバージョンなど)
googleスプレッドシート
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。