質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.49%
JavaScript

JavaScriptは、プログラミング言語のひとつです。ネットスケープコミュニケーションズで開発されました。 開発当初はLiveScriptと呼ばれていましたが、業務提携していたサン・マイクロシステムズが開発したJavaが脚光を浴びていたことから、JavaScriptと改名されました。 動きのあるWebページを作ることを目的に開発されたもので、主要なWebブラウザのほとんどに搭載されています。

jQuery

jQueryは、JavaScriptライブラリのひとつです。 簡単な記述で、JavaScriptコードを実行できるように設計されています。 2006年1月に、ジョン・レシグが発表しました。 jQueryは独特の記述法を用いており、機能のほとんどは「$関数」や「jQueryオブジェクト」のメソッドとして定義されています。

HTML

HTMLとは、ウェブ上の文書を記述・作成するためのマークアップ言語のことです。文章の中に記述することで、文書の論理構造などを設定することができます。ハイパーリンクを設定できるハイパーテキストであり、画像・リスト・表などのデータファイルをリンクする情報に結びつけて情報を整理します。現在あるネットワーク上のほとんどのウェブページはHTMLで作成されています。

Q&A

解決済

3回答

4872閲覧

body に書かれた内容をそのまま取得したい

sk_3122

総合スコア1126

JavaScript

JavaScriptは、プログラミング言語のひとつです。ネットスケープコミュニケーションズで開発されました。 開発当初はLiveScriptと呼ばれていましたが、業務提携していたサン・マイクロシステムズが開発したJavaが脚光を浴びていたことから、JavaScriptと改名されました。 動きのあるWebページを作ることを目的に開発されたもので、主要なWebブラウザのほとんどに搭載されています。

jQuery

jQueryは、JavaScriptライブラリのひとつです。 簡単な記述で、JavaScriptコードを実行できるように設計されています。 2006年1月に、ジョン・レシグが発表しました。 jQueryは独特の記述法を用いており、機能のほとんどは「$関数」や「jQueryオブジェクト」のメソッドとして定義されています。

HTML

HTMLとは、ウェブ上の文書を記述・作成するためのマークアップ言語のことです。文章の中に記述することで、文書の論理構造などを設定することができます。ハイパーリンクを設定できるハイパーテキストであり、画像・リスト・表などのデータファイルをリンクする情報に結びつけて情報を整理します。現在あるネットワーク上のほとんどのウェブページはHTMLで作成されています。

0グッド

0クリップ

投稿2016/12/21 08:40

編集2016/12/21 09:59

###前提・実現したいこと

body に書かれた内容を、javascript でそのまま取得したいです。

###発生している問題・エラーメッセージ

何パターンか試してみたのですが、<= が <= に変換されてしまう ケースなどがありました。
できればまったくそのままの形で取得したいのですが…

###試したこと

  • jQuery を使用して $("body").html()
  • document.body.innerHTML
  • document.body.childNodes を回してみる

###該当のソースコード

html

1<!DOCTYPE html> 2<html> 3<head> 4<script src="https://code.jquery.com/jquery-1.9.1.js"></script> 5<script> 6 $(function() { 7 console.clear(); 8 9 //======================================== 10 // jQuery で取ってみる 11 // ⇒ <= が &lt;= になる 12 //======================================== 13 var jq = $("body").html(); 14 15 console.log("=== jq ===================="); 16 console.log(jq); 17 18 //======================================== 19 // 標準 javascript で取ってみる 20 // ⇒ <= が &lt;= になる 21 //======================================== 22 var js = document.body.innerHTML; 23 24 console.log("=== pure js ===================="); 25 console.log(js); 26 27 //======================================== 28 // childNodes から取ってみる 29 // ⇒ 逆に &lt;= が <= になる 30 //======================================== 31 var str = ""; 32 for (var i = 0, imax = document.body.childNodes.length-1; i <= imax; i++) { 33 var childNode = document.body.childNodes[i]; 34 str += (childNode.nodeValue || childNode.outerHTML); 35 } 36 37 console.log("=== childNodes ===================="); 38 console.log(str); 39 }); 40</script> 41</head> 42<body> 43 小なりが変換されてしまう。そのまま取りたい。 44 タグは変換されないのに 45 46 <div>あいう</div> 47 48 <ul> 49 <li>test</li> 50 </ul> 51 52 ``` 53 if (list.length <= 0) ... 54 ``` 55 56 if (list.length <= 0) ... 57 58 &lt;= 59 60</body> 61</html>

###補足情報(言語/FW/ツール等のバージョンなど)

  • とりあえず Windows10 : IE11 と Chrome で動けば良いかなと思っています。
  • jQuery のバージョン等に指定はないです。

###その他

  • そもそも何でそんなことをしたいのか
    ⇒ 「body にマークダウンでドキュメントを記述」して、
    「marked.js というライブラリで変換して再設定」としようとしたところ、

意図しない変換がかかっている部分があったという経緯です。

(marked.js はマークダウンで書いたものを HTML タグに変換してくれるライブラリ)

$("body").html() が <= を < で返しており、
marked.js は < をさらに &lt; に変換しているようなので、
最終的にブラウザ上で 比較式が <= と表示されてしまっています。

その為、<= ではなく <= の状態で marked.js に渡せないものかと考えています。


  • マークダウンは別ファイルで記述して、それを読み込む… としない理由
    ⇒ 一応 ローカルでも動かせると良いなあと思った為です。
    別ファイルにして~の読み込み~ だとローカルで動かないので
    (ブラウザの設定をいじれば動くのは知ってるんですけど…)

  • *.md で書かないで marked.js を使う理由
    ⇒ どうしても無理なら仕方ないのですが、可能であればビューアーのインストール等をせずに、
    ブラウザでぺろっと見られると良いなと思いました。

追記: この辺 ↓ とかの関係ですかね… そのまんまは取れないのでしょうか

innerHTML や jQuery.html() は HTMLをそのまま取得できるわけではない
http://jmblog.jp/archives/876


何かお分かりになる方がいらっしゃいましたら よろしくお願いします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答3

0

ちょっと状況がわからないのですが
以下サンプルだと普通に表示されますね

HTML

1<html> 2<head> 3<script src="http://ajax.googleapis.com/ajax/libs/jquery/1.12.4/jquery.min.js"></script> 4<script> 5$(function(){ 6 $('[type=button]').on('click',function(){ 7 alert($('body').html()); 8 }); 9}); 10</script> 11</head> 12<body> 13<script> 14if(1<=2) console.log(3); 15</script> 16<input type="button" value="hoge"> 17</body> 18</html>

投稿2016/12/21 09:25

yambejp

総合スコア114757

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

sk_3122

2016/12/21 10:01 編集

ありがとうございます。 頂いたサンプルだと、確かに <= のままで表示されました。 <script> の中だと変換されないようです? if(1<=2) console.log(3); の上下の <script> タグを削除すると、やはり &lt;= となってしまいました。
guest

0

ベストアンサー

<!--[CDATA[ ]]--> で挟んどいて innerHTML で取得して CDATA 部分を取り除くとか。

私は marked.js では textarea.val() で取得したのを入れてました。

投稿2016/12/21 13:11

退会済みユーザー

退会済みユーザー

総合スコア0

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

退会済みユーザー

退会済みユーザー

2016/12/21 13:17

ちなみに関係ないですが marked(str, breaks: true) とすると Github wiki 風の自動改行になります。
sk_3122

2016/12/22 01:16

ありがとうございます! <!--[CDATA[ ]]--> で挟むと本当にそのままのものが取れました! たとえば <p><div>あいう</div></p> のような間違ったマークアップでも そのままの文字列で取れました。 # $("body").html() だとブラウザが解釈したものが返ってくるので # 上記の書き方だと <p></p><div>あいう</div><p></p> とかになる ありがとうございます。
guest

0

HTML で <&lt; と書くのが正しくて、そうなってないところをブラウザが自動で修正してくれてるわけですから、 &lt; になってるべきです
HTML 要素がいらなくてテキストが欲しいなら .text() でとれます
.text() で困るなら .html().replace(/&lt;/g, "<") のように置換するしかないと思います

投稿2016/12/21 11:22

lazex

総合スコア604

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

sk_3122

2016/12/22 01:17

> HTML で < は &lt; と書くのが正しくて、そうなってないところをブラウザが自動で修正してくれてるわけですから、 &lt; になってるべきです ああー そうですよね、結局のところ「テキスト」ではなくて あくまで「HTML」ですもんね。 そもそも「書いてある文字をそのまま」みたいな使い方をするものではないということですよね… 確かに… <!--[CDATA[ ]]--> で囲むか replace するか、どちらかにしようと思っています。 # 文中に <!--[CDATA[ ]]--> が登場したら… とか言い出すとキリがないですが、それを考えるなら replace # ただし HTML 的に正しくないマークアップがもしあったら直されてしまうので、そちらを優先させるなら <!--[CDATA[ ]]--> ですかね… ありがとうございます。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.49%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問