🎄teratailクリスマスプレゼントキャンペーン2024🎄』開催中!

\teratail特別グッズやAmazonギフトカード最大2,000円分が当たる!/

詳細はこちら
RPA

RPA(Robotic Process Automation)は、ホワイトカラーの間接業務を人間に代行して自動的に行う技術や概念を指します。人間が繰り返すクリックやキーボード入力といった定型的なデスクワークを行うことから、仮想知的労働者(Digital Labor)と呼ばれることがあります。

Blue Prism

Blue Prismは、複数ロボットの統括管理RPAです。各企業の事業部門に分散されているロボットに対し、プロセスの制御・監視・実行・スケジュールを行うコンソールでロボットの運用を推進。内部統制を強化できます。

HTML

HTMLとは、ウェブ上の文書を記述・作成するためのマークアップ言語のことです。文章の中に記述することで、文書の論理構造などを設定することができます。ハイパーリンクを設定できるハイパーテキストであり、画像・リスト・表などのデータファイルをリンクする情報に結びつけて情報を整理します。現在あるネットワーク上のほとんどのウェブページはHTMLで作成されています。

Q&A

解決済

1回答

2303閲覧

[Blue Prism]Webページの要素の数を数える方法を探しています。

sumire_cl

総合スコア228

RPA

RPA(Robotic Process Automation)は、ホワイトカラーの間接業務を人間に代行して自動的に行う技術や概念を指します。人間が繰り返すクリックやキーボード入力といった定型的なデスクワークを行うことから、仮想知的労働者(Digital Labor)と呼ばれることがあります。

Blue Prism

Blue Prismは、複数ロボットの統括管理RPAです。各企業の事業部門に分散されているロボットに対し、プロセスの制御・監視・実行・スケジュールを行うコンソールでロボットの運用を推進。内部統制を強化できます。

HTML

HTMLとは、ウェブ上の文書を記述・作成するためのマークアップ言語のことです。文章の中に記述することで、文書の論理構造などを設定することができます。ハイパーリンクを設定できるハイパーテキストであり、画像・リスト・表などのデータファイルをリンクする情報に結びつけて情報を整理します。現在あるネットワーク上のほとんどのウェブページはHTMLで作成されています。

1グッド

0クリップ

投稿2019/09/25 07:15

編集2019/09/26 07:26

#実現したいこと

webページに含まれる要素の数を数えたいです。
たとえば<li>が何個あるか、とか。

#発生している問題

何を使ったら、要素数を数える(取得して配列にするとか……?)ことができるのかがわかりません。

たとえばJQueryなら

JQuery

1$(function() { 2 var size = $('li').length; 3 alert(size); 4});

VBAだったら

VBA

1size=document.getElementsByTagName("li").length 2MsgBox size

これをBluePrismでやるとしたら、何を使ってどのようにしたらいいのでしょうか?
Get HTML でソースコードを全部取得して、ループでまわして探すようなのしかないのでしょうか。

※「ループでまわして探す」のは、まえにテキストから文字列を探す質問をここでしたときに書きました
[teratail]テキストファイルから欲しい文字列を抽出したいのですが、時間がかかってしまいます。

EnterpriseOcean👍を押しています

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

以下の AVO.Regex を用いると HTML のソースに対して正規表現を用いた検索が可能となります。

AVO.Regex

具体的には以下のように AVO.Regex の [Extract All Matches As Collection] アクションを用いると LI 要素を抽出したコレクションを取得することができます。

イメージ説明

その後に取得したコレクションに対して、[コレクション] VBO の [行をカウント] アクションを用いると件数を取得することができました。

ここでのキモは [Regex Pattern] 項目へ正規表現で "<LI[\ >]" と指定すると "<LI " と "<LI>" だけを抽出することができます。

また、[Regex Option: Ignore Case] 項目へ True を指定して大文字小文字の区別をしないようにしています。

この案でご要望が実現できますでしょうか?

投稿2019/09/30 08:18

編集2019/09/30 08:22
EnterpriseOcean

総合スコア276

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

sumire_cl

2019/10/01 00:48

ホントだ!できました! Get HTMLで該当箇所のソースコードを取って、RegExのExtract All Matches As CollectionでCollectionにして、そのCollectionをCount Rowsで数えたら、要素の数がわかるということですね。 たとえば社内システムで、検索した結果が何個あったのかによって後が変わってくるときに、重くなく手っ取り早く数だけわかったらいいなと思って質問しました。 ありがとうございます!正規表現はふわっとしか書けないので勉強します!
EnterpriseOcean

2019/10/01 02:50

正規表現は面白いですねー。私も簡単な表現しか知らないので勉強します。 今、vimで以下のように検索すると "東京都" と "大阪府" だけがマッチすることを確認しました! /(東京都\|大阪府)
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.36%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問