質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.47%
Google Colaboratory

Google Colaboratoryとは、無償のJupyterノートブック環境。教育や研究機関の機械学習の普及のためのGoogleの研究プロジェクトです。PythonやNumpyといった機械学習で要する大方の環境がすでに構築されており、コードの記述・実行、解析の保存・共有などが可能です。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Unicode

Unicodeはエンコーディングの標準規格です。1つの文字コード体系で多国語の表現を可能にすることを目指して作られています。

selenium

Selenium(セレニウム)は、ブラウザをプログラムで作動させるフレームワークです。この原理を使うことにより、ブラウザのユーザーテストなどを自動化にすることができます。

Q&A

0回答

284閲覧

Selenium+chrome Unicodeの一部が□で表示されてしまう。

Quuchan

総合スコア1

Google Colaboratory

Google Colaboratoryとは、無償のJupyterノートブック環境。教育や研究機関の機械学習の普及のためのGoogleの研究プロジェクトです。PythonやNumpyといった機械学習で要する大方の環境がすでに構築されており、コードの記述・実行、解析の保存・共有などが可能です。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Unicode

Unicodeはエンコーディングの標準規格です。1つの文字コード体系で多国語の表現を可能にすることを目指して作られています。

selenium

Selenium(セレニウム)は、ブラウザをプログラムで作動させるフレームワークです。この原理を使うことにより、ブラウザのユーザーテストなどを自動化にすることができます。

0グッド

0クリップ

投稿2022/06/01 14:17

ユニコードの一部文字と絵文字が「□」と表示されてしまいます。
この問題を解決したいのでお知恵を拝借願います。

GoogleColaboratoryを活用し、seleniumでスクレイピングを行っています。
指定のURLにアクセスし、画面キャプチャを行うとUnicodeの一部が□で表示されてしまいます。
特に絵文字類は全滅です。通常のUnicodeでも一部は□で表示されます。

そのため、環境設定のどこかがおかしいとは思っているのですが解決策が分かりません。

よろしくお願いします。

実行環境
GoogleColaboratory
バージョン Python 3.7.13

Python

1# 日本語フォントインストール 2!apt-get -y install fonts-ipafont-gothic 3!apt-get -y install fonts-ipafont-mincho 4 5# 実行前の準備 6!pip install selenium 7!apt-get update # to update ubuntu to correctly run apt install 8!apt install chromium-chromedriver 9!cp /usr/lib/chromium-browser/chromedriver /usr/bin 10 11 12#webDriverを使うための準備 13import sys 14sys.path.insert(0,'/usr/lib/chromium-browser/chromedriver') 15from selenium import webdriver 16chrome_options = webdriver.ChromeOptions() 17chrome_options.add_argument('--headless') 18chrome_options.add_argument('--no-sandbox') 19chrome_options.add_argument('--disable-dev-shm-usage') 20chrome_options.add_argument('--lang=ja-JP') 21 22driver = webdriver.Chrome('chromedriver',chrome_options=chrome_options) 23 24#ウィンドウサイズの設定 25driver.set_window_size(1920,1080) 26 27driver.get('http://guppy.eng.kagawa-u.ac.jp/~kagawa/OpenCampus/unicode.html') 28driver.save_screenshot('screenshot-full.png')

左記URLへのアクセス結果(http://guppy.eng.kagawa-u.ac.jp/~kagawa/OpenCampus/unicode.html)
上記のプログラムからアクセスした際のスクリーンショット

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだ回答がついていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.47%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問