質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
Go

Go(golang)は、Googleで開発されたオープンソースのプログラミング言語です。

Q&A

解決済

1回答

2478閲覧

Go言語で<div>~</div>で入れ子になったデータを抜き出すには

退会済みユーザー

退会済みユーザー

総合スコア0

Go

Go(golang)は、Googleで開発されたオープンソースのプログラミング言語です。

0グッド

0クリップ

投稿2017/08/10 03:49

以下のように<div></div>で入れ子になったリストがあるHTMLのページからデータを抜き出したいのですが、方法が分かりません。

xmlパッケージを使えば解決できるようですが、具体例が見つけることができず挫折しました。宜しくお願いします。

html

1<div class="hoge"> 2 <div class="fuga">title1</div> 3 リスト1 4</div> 5 6<div class="hoge"> 7 <div class="fuga">title2</div> 8 リスト2 9</div> 10 11<div class="hoge"> 12 <div class="fuga">title3</div> 13 リスト3 14</div> 15

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

goquery を使えば簡単にできます。

go

1package main 2 3import ( 4 "fmt" 5 "log" 6 "strings" 7 8 "golang.org/x/net/html" 9 10 "github.com/PuerkitoBio/goquery" 11) 12 13func main() { 14 doc, err := goquery.NewDocumentFromReader(strings.NewReader(` 15 <div class="hoge"> 16 <div class="fuga">title1</div> 17 リスト1 18 </div> 19 20 <div class="hoge"> 21 <div class="fuga">title2</div> 22 リスト2 23 </div> 24 25 <div class="hoge"> 26 <div class="fuga">title3</div> 27 リスト3 28 </div> 29 `)) 30 if err != nil { 31 log.Fatal(err) 32 } 33 34 // fuga の中身を得るならば 35 doc.Find(".hoge .fuga").Each(func(n int, s *goquery.Selection) { 36 fmt.Println(s.Text()) 37 }) 38 39 // fuga の中のテキストノードの値だけを得るならば 40 doc.Find(".hoge").Each(func(n int, s *goquery.Selection) { 41 for _, node := range s.Contents().Nodes { 42 if node.Type == html.TextNode { 43 fmt.Print(node.Data) 44 } 45 } 46 }) 47}

投稿2017/08/10 16:09

mattn

総合スコア5030

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

退会済みユーザー

退会済みユーザー

2017/08/11 05:06

うぉーうまくできました!goquery便利ですね 大変助かりました回答どうもありがとうございます!
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問