常連

# Macにてpythonの環境設定を行いたい

python3.7.7をインストールし、これのpathを通したいのだが
どのようにすれば良いのでしょうか。

# ゴール
```
$ which python
/Library/Frameworks/Python.framework/Versions/3.X/bin/python
```

#やったこと
- pathを記載するためのbash_profileがなかったので作成
```
%touch ~/.bash_profile
```

- vimでファイルを開く
```
%vim ~/.bash_profile
```


- pathを記入する
```
%export PATH=/Library/Frameworks/Python.framework/Versions/3.7.7/bin:$PATH
```

- 実行できるようにする
```
%source ~/.bash_profile
```

# わからなかったこと
- pathが通っているか確認
```
%which python
/usr/bin/python
```
pathが通っていなかった

-しかし、以下で確認すると　pathが記載されている
```
echo $PATH
/Library/Frameworks/Python.framework/Versions/3.7.7/bin:/Library/Frameworks/Python.framework/Versions/3.7/bin:/usr/local/bin:/usr/bin:/bin:/usr/sbin:/sbin
```

# コメント
本日、初めてmacのターミナルを触りましたので初歩的な間違いがありましたら
ご指摘いただけると幸いです。

pythonのPATHをMacで通したい

### 前提・実現したいこと

当方、Googleスプレッドシート使用初心者です。

Googleスプレッドシートでプレスリリースサイトのリリース元情報リストを作成しています。
A2に入力されたURLから、企業名を取得する関数の作成中です。

企業名をIMPORTXMLで取得中にエラーメッセージが発生しました。

いくつかサイトを回ってみましたが、具体的な解決策が見つからず、
お力お貸しいただけますと幸いです。

◆取得元
https://prtimes.jp/main/html/rd/p/000000417.000006823.html

◆取得したXPath
//*[@id="sidebar"]/aside[1]/h2

◆作成した関数
=IMPORTXML(A2,"//*[@id='sidebar']/aside[1]/h2")

### 発生している問題・エラーメッセージ

```
エラー
インポートしたコンテンツは空です。
```

### 該当のソースコード
企業名は伏せて記述させていただきます。

```HTML
<div id="sidebar" class="sidebar">
        <aside class="sidebar-release">
            <h2>株式会社○○</h2>
            <p class="sidebar-releaseArrow"></p>
```

### 試したこと

どこから手を付けてよいかわからず。
=IMPORTXML(A2,"//*[@class='sidebar-release']/aside[1]/h2")

に変えてみたりなど、初心者なりにいじくり回しましたが、さっぱりです。

IMPORTXMLでインポートしたコンテンツは空ですとエラーが出てしまいます。

### 前提・実現したいこと
seleniumを用いてWebページ上で行う業務の自動化をしたい。
行いたい操作はアクセスしたWebページ内のbutton要素をクッリクし、
文書を作成するというものです。

Pythonは3.7を使用しています。
### 発生している問題・エラーメッセージ
XPathで指定した要素が見つからずエラーを返されます。
XPathはGoogle Choromeのデベロッパーツールにて要素のXPathをコピーしています。
Webページ上のbutton要素を指定できる方法をご教示お願いいたします。
```
selenium.common.exceptions.NoSuchElementException: Message: no such element: Unable to locate element: {"method":"xpath","selector":"//*[@id="list-control"]/section[2]/div/div[2]/div[1]/button[2]"}
```

### 該当のソースコード
Webページの当該カ所のHTMLソースコードです。
![イメージ説明](82e4219a7d85b87c78505d0cddeaecb6.jpeg)

作成したスクリプトのimport文とエラーカ所です。
```python
import time
from selenium import webdriver

driver = webdriver.Chrome(executable_path='C:\Program Files\Python37\Lib\site-packages\chromedriver')
driver.get('https://hoge.jp/login')
#(中略)
FAX_menu = driver.find_element_by_xpath("//*[@id=\"dashboard\"]/div[1]/ul/li[1]/a").click()
#上の行まではエラーなく動作する

NEW = driver.find_element_by_xpath('//*[@id=\"list-control\"]/section[2]/div/div[2]/div[1]/button[2]')
#エラーを返すカ所
NEW.click()
```

### 試したこと

以下のようCSSセレクタでの要素の指定も試したところ上手くいきませんでした。
```python
NEW = driver.find_element_by_css_selector(".btn-info")
NEW = driver.find_element_by_css_selector("btn.btn-info.btn-sm")
NEW = driver.find_element_by_css_selector(".btn.btn-info.btn-sm")
NEW = driver.find_element_by_css_selector("button.btn.btn-info.btn-sm")
```

seleniumでXPathで指定したエレメントが見つからない

# 前提・実現したいこと 

どうやっても取得できないXPathがあったので、取得の方法を知りたく質問しました。

目的：スプレットシートのimportXML関数(XPath)を利用し、データを抽出する

サイト
https://www.julian-fashion.com/en-US/product/120833/etro/beachwear/coulisse_swimshorts


# 該当のソースコード

抜きたい情報がサイト内のこの部分で
ブランド名　E---
商品名 C--------(略)-------　←今回はココ
値段：

右クリックから取得したXPathは以下となります。
/html/body/div[3]/div[8]/div/div[2]/div/div[2]/span[2]/span[2]

```ソースコード
=importXML("https://www.julian-fashion.com/en-US/product/120833/etro/beachwear/coulisse_swimshorts"
,"/html/body/div[3]/div[8]/div/div[2]/div/div[2]/span[2]/span[2]")
```

# 発生している問題・エラーメッセージ


```
結果：Error：インポートしたコンテンツが空です。
```


# 試したこと
pathを右から削って検証した所、
/html/body/div[3]/div[8]まで表示出来ました。
過去のログを見た所、このようなコメントがあったので、

＞chromeのcopy xpathには対応していない
＞/を//に変えれば大体いけますけどね。

ので、スラッシュを増やして入力した所、
/html/body/div[3]/div[8]//div
まで取得出来ました。

ただ、ページのソースコード内に書いてない内容が返されて意味が分かりません。
更に、次に進もうと、
/html/body/div[3]/div[8]//div//div　(または//div)
の時点でError：コンテンツが空と出ます。
どういうことなのでしょうか？

# 補足情報（FW/ツールのバージョンなど）

他の質問を見る限り、動的にコンテンツを生成するとダメというのは分かったのですが、
「動的にコンテンツを取得しているか」が分からない為、質問させていただきました。

このサイトでもなくてもimportXMLは
/html/body/～から始まるXPathが大体機能しない。
というか機能する形は
//*[@id="menu"]　みたいな属性？を指定する物。

有識者の方、よろしくお願いいたします。

※Seleniumが楽と多々見るので、これから触ってみたいと思います。


【追記】
CSS セレクタをXPathに変換する(サイト下部)
https://piro.sakura.ne.jp/latest/blosxom/mozilla/xul/2007-09-13_selector-to-xpath.htm
を見つけて変換した所、
```
/html/body/div[3]/div[8]/div/div[2]/div
```
が以下になりました。
```
/descendant::*[local-name() = "/html/body/div/div/div/div/div" or local-name() = "/HTML/BODY/DIV/DIV/DIV/DIV/DIV"][(@3) and (@8) and (@2)]"
```
そのまま打ち込むと"(ダブルコーテーション)云々でバグったので一旦別のセルに入れて参照した所機能しました。

この状態で参照すると「URLが参照できません」と出ます。
同じ内容をURLを打ち込むと出来るんですが、参照できないらしいですね。

なお、　最後に「/h2」があると内部インポートエラーになりました。

スプレットシートのimportXML関数でエラーが出る(コンテンツが空です)

xpathが//*[@id="SV"]や//*[@id="GF"],//*[@id="FK"]となっている要素（任意の大文字二つ）をcntainsと正規表現を使い、取得したいのですが、containsの第二引数はどのように表現したらいいのでしょうか？


以下のようにやりましたがダメでした
```ここに言語を入力
xpath('//*[contains(@id ,"\w")]')
```

xpathをcontainsと正規表現を使って表す方法

最近、スクレイピングなんてものが流行ってるようで、
私も簡単な処理を頼まれててVBAで作りました。

MSXMLというものがあるので、
これでXPAthで簡単に取れるだろうと思ったのですが、どうもうまくいきません。
XMLを前提にしているので、HTMLだとタグ等が壊れている場合も多く、エラーになります。
まぁ、当たり前と言えば当たり前ですが。

納期があるので、今回はDomでgetElementBy〜で処理したのですが、
なんとなく、XPathの方がオサレだよなぁと思うわけです。

今後も含めて何かいい方法があるに違いないと思って調べてみると
`validateOnParse = False` とすると良さ気なのでやってみても
警告レベルのエラーでもパース出来ず結局エレメントが取得できません。

Webのサンプルを参考にしながらテストでこんな風に書きました。

```VBA
Sub XPathTest()

    Dim dom As DOMDocument30
    Set dom = New DOMDocument30
    dom.async = False
    dom.validateOnParse = False
    dom.setProperty "SelectionLanguage", "XPath"
    
    Dim objXML As New MSXML2.XMLHTTP
    Dim ret As Boolean

    With objXML
        .Open "GET", "http://www.example.com/", False
        .send (Null)
        ret = dom.LoadXML(.responseText)
    End With

    Dim nodelist As IXMLDOMNodeList
    Set nodelist = dom.DocumentElement.SelectNodes("//tr")
       
    Debug.Print nodelist.Item(0).nodeName

End Sub
```

処理を渡す前にHTMLをある程度加工してあげればうまくいくかもとも思いましたが、
ちょっとやっぱり現実的ではないですよね。


調査する際は、ブラウザのコンソールで$x('//tr')とかやるとさっくり取ってくれます。
PHPでもダメなのかと思って書いてみたら、警告は出るもののエレメントの取得は出来ます。

なので、VBAでもなんとかうまいこと出来ないものかと思って調べてみても、
なかなかこれはという情報に行き当たりません。

MSXMLじゃなくてもいいので、XPathエンジン的なものでも
呼び出して処理するというような方法は無いものでしょうか？

何か情報がございましたら、ご回答よろしくお願い致します。

VBAでHTMLに対してXPathで取得する良い方法ないですか？

### 前提・実現したいこと

スプレッドシートのIMPORTXML関数で、サイトの内のデータを取得したいので、お力添え頂きたいです。m(_ _)m

参考サイトを見て、行いました、色々と試してみたのですが、なかなか取れず断念しました。
→[https://qiita.com/Octoparse_Japan/items/324d53841e286e3ac7d3](https://qiita.com/Octoparse_Japan/items/324d53841e286e3ac7d3)

実際とは異なるサイトですが、同じテーマなので下記サイトから取得したいです。
[https://xeory.jp/base/](https://xeory.jp/base/)

**取得したいテキスト：2014.10.16**
```HTML
<div id="main" class="col-md-8" role="main" >
  <div class="main-inner"">
    <article>
      <header class="post-header">
        <ul class="post-meta list-inline">
          <li class="date updated" itemprop="datePublished" datetime="2014-10-16T10:27:29+00:00"><i class="fa fa-clock-o"></i> 2014.10.16</li>
        </ul>
        <h1 class="post-title" itemprop="headline">ページタイトル</h1>
      </header>
    </article>
  </div>
</div>
```
サイトはワードプレスで作成されています。
シンプルにするため一部のコードは簡易化しています。
### 発生している問題・エラーメッセージ

```
エラー：インポートしたコンテンツは空です。（#N/A）
```

### 該当のソースコード


スプレッドシートでの記入
```spreadsheet
=IMPORTXML(B21,"//*[@id='main']/header/ul/li/text()")
```
※B21は該当ページのURL

### 試したこと

- text()を「.」へ変更
- 「/text()」を削除

細かい修正をいくつか試してみましたが、ことごとく外れました・・
コツがあれば知りたいです。

### 補足情報（FW/ツールのバージョンなど）

特になし

スプレッドシートのIMPORTXML関数で「インポートしたコンテンツは空です」が解決しない

###前提・実現したいこと
rubyでnokogiriを使ってウェブスクレイピングしようとしています。
一通りプログラムは組めたのですが、以下のようなエラーが発生してしまいます。

###発生している問題・エラーメッセージ

```
18: syntax error, unexpected end-of-input, expecting keyword_end
```

###該当のソースコード
```ruby
#!/usr/bin/ruby
require 'mechanize'
agent = Mechanize.new 
agent.user_agent_alias = 'Windows Mozilla' 

url = 'http://www.watashi-move.jp/pc/login.php' 
page = agent.get(url) 
mypage = page.form_with(id: 'form1') do |form| 
form.loginid = '*' 
form.password = '*' 
end.submit

url = 'https://www.watashi-move.jp/wl/mydata/sphygmomanometer.php?targetDate=2016/07/01' 
page = agent.get(url)
doc = page.root 
doc.xpath('//tr[@class="day13"]/td[@class="pressureMin"]').text
puts doc.xpath('//tr[@class="day13"]/td[@class="pressureMin"]').text
end
```

###試したこと
ネットなどで調べて-wオプションを実行してみたら
8:warning:assigned but unused variable -mypage
mechanize/cookie will be deprecated. please migrate to the http-cookie APIs.
mechanize/cookie_jar will be deprecated.please migrate to the http-cookie APIs.
と出力されました。
調べてみたのですが、よく理解できませんでしたので、
よろしくお願い致します。
###補足情報(言語/FW/ツール等のバージョンなど)
より詳細な情報

XPath(XML Path)