質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
XML

XMLは仕様の1つで、マークアップ言語群を構築するために使われています。

Java

Javaは、1995年にサン・マイクロシステムズが開発したプログラミング言語です。表記法はC言語に似ていますが、既存のプログラミング言語の短所を踏まえていちから設計されており、最初からオブジェクト指向性を備えてデザインされています。セキュリティ面が強力であることや、ネットワーク環境での利用に向いていることが特徴です。Javaで作られたソフトウェアは基本的にいかなるプラットフォームでも作動します。

RSS

RSS(Really Simple Syndication)はブログのエントリやニュースの見出し、標準のフォーマットの音声やビデオなどを発行するために使われるウェブフィードのフォーマットの集合体です。

XPath(XML Path)

XML Path Language (XPath; XMLパス言語)は、マークアップ言語 XML に準拠した文書の特定の部分を指定する言語構文の事をいいます。XPathはXMLとは別の構文を使用します。XMLドキュメントの抽象、論理ストラクチャ上で動作します。

Q&A

解決済

1回答

3202閲覧

JavaでRSS1.0に対してXPathを使う

tonkatu05

総合スコア25

XML

XMLは仕様の1つで、マークアップ言語群を構築するために使われています。

Java

Javaは、1995年にサン・マイクロシステムズが開発したプログラミング言語です。表記法はC言語に似ていますが、既存のプログラミング言語の短所を踏まえていちから設計されており、最初からオブジェクト指向性を備えてデザインされています。セキュリティ面が強力であることや、ネットワーク環境での利用に向いていることが特徴です。Javaで作られたソフトウェアは基本的にいかなるプラットフォームでも作動します。

RSS

RSS(Really Simple Syndication)はブログのエントリやニュースの見出し、標準のフォーマットの音声やビデオなどを発行するために使われるウェブフィードのフォーマットの集合体です。

XPath(XML Path)

XML Path Language (XPath; XMLパス言語)は、マークアップ言語 XML に準拠した文書の特定の部分を指定する言語構文の事をいいます。XPathはXMLとは別の構文を使用します。XMLドキュメントの抽象、論理ストラクチャ上で動作します。

0グッド

0クリップ

投稿2016/01/08 03:37

編集2016/03/28 11:17

javaでXPathを使ってうまくRSSを取得できません。
例えば、
http://b.hatena.ne.jp/entry/rss/http://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q1027682090
このRSSから/rdf:RDF/channel/items/rdf:Seq/rdf:liNodeListを得たいのですが、

java

1NodeList linkList = (NodeList) xPath.evaluate("/rdf:RDF/channel/items/rdf:Seq/rdf:li", document, XPathConstants.NODESET);

としてもうまく取得できていない様子です。

http://d.hatena.ne.jp/stog/20090928/1254157785
この記事のように名前空間の問題らしいのですが、そこのところをよく分かっていなく、Javaでの書き方も良くわからないです。

どのように書けば/rdf:RDF/channel/items/rdf:Seq/rdf:liNodeListを得られるでしょうか?

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

この場合、rdf:の部分を無視して、/RDF/channel/items/Seq/liとしてしまえば読み出すことはできます。

いちおう、名前空間を認識させる処理も書いておきます。
名前空間を処理するには、NamespaceContextというインターフェイスを実装します。
ただこの場合、NamespaceContextがあってもなくても動作するので、正しいのかどうかちょっと怪しいです。

  • JavaでRSS1.0の要素(channel/items)を読み込むサンプル

lang

1// import java.io.*; 2// import java.util.*; 3// import javax.xml.namespace.NamespaceContext; 4// import javax.xml.parsers.*; 5// import javax.xml.xpath.*; 6// import org.w3c.dom.*; 7// import org.xml.sax.SAXException; 8 9// XML(RDF)ファイル 10File file = new File("./data.xml"); 11 12// RDFのNamespaceContext実装 13NamespaceContext nsc = new NamespaceContext() { 14 final String prefix = "rdf"; 15 final String uri = "http://www.w3.org/1999/02/22-rdf-syntax-ns#"; 16 @Override 17 public Iterator<?> getPrefixes(String namespaceURI) { 18 return Arrays.asList(prefix).iterator(); 19 } 20 @Override 21 public String getPrefix(String namespaceURI) { 22 if (uri.equals(namespaceURI)) { 23 return prefix; 24 } 25 return ""; 26 } 27 @Override 28 public String getNamespaceURI(String prefix) { 29 if (this.prefix.equals(prefix)) { 30 return uri; 31 } 32 return ""; 33 } 34}; 35 36// XMLパース 37Document doc; 38try { 39 DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance(); 40 DocumentBuilder builder = factory.newDocumentBuilder(); 41 doc = builder.parse(file); 42} catch (ParserConfigurationException | SAXException | IOException e) { 43 throw new RuntimeException(e); 44} 45 46// XPath適用 47XPathFactory xPathFactory = XPathFactory.newInstance(); 48XPath xpath = xPathFactory.newXPath(); 49xpath.setNamespaceContext(nsc); 50NodeList nodes; 51try { 52 XPathExpression expr = xpath.compile("/RDF/channel/items/Seq/li"); 53 nodes = (NodeList)expr.evaluate(doc, XPathConstants.NODESET); 54} catch (XPathExpressionException e) { 55 throw new RuntimeException(e); 56} 57for (int i = 0; i < nodes.getLength(); i++) { 58 Node node = nodes.item(i); 59 NamedNodeMap map = node.getAttributes(); 60 for (int j = 0; j < map.getLength(); j++) { 61 System.out.println(map.item(j)); 62 } 63}

参考リンク:

XPathで名前空間URIを使う - (旧)サンフラットの開発日記
http://d.hatena.ne.jp/sunflat/20080430/p2

NamespaceContext - Java SE 8 API ドキュメント
https://docs.oracle.com/javase/jp/8/docs/api/javax/xml/namespace/NamespaceContext.html

投稿2016/01/08 08:32

argius

総合スコア9388

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

tonkatu05

2016/01/09 07:22

ご回答ありがとうございます! rdf:を無視すればいいだけだったのですね。 詳しく教えて下さりありがとうございます。もう少し勉強してみます。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問