Rselenium 一些應用與教學

內容說明

主要是透過 Rselenium 來模擬人類打開網頁並對其進行操作,以下是一些 Rselenium 下載的教學步驟

安裝 Rselenium

1
install.packages("RSelenium")

安裝 WebDriver

Step 1:

由於我們安裝好 Selenium 後,Selenium 是程式語言與 browser 溝通的關鍵,於是我們還需要安裝一個機器人專用的瀏覽器來給他進行操控,目前支持機器人操控瀏覽器的有 Google Chrome and Firefox

首先先去這裡,找到目前最新的 Selenium Server 版本,作者在寫此文章時是這個版本。

如果電腦沒有 java 必須先去下載 java 才能安裝成功,建議可以將命令先 cd 至爬蟲資料夾

1
# java -jar selenium-server-standalone-X.XXX.XX.jar

Step 2:

下一步則是我們要將 Google Chrome 專用的瀏覽器進行下載,先在 R console 中輸入

1
binman::list_versions("chromedriver")

應該要能夠出現,以下的感覺

1
"85.0.4183.87" "86.0.4240.22" "87.0.4280.20"

接著去此網站,下載最適合的版本,並放入你寫程式的資料夾內,建議放入與上述 selenium-server-standalone-X.XXX.XX.jar相同位置

參考連結

RSelenium:R 使用 Selenium 操控瀏覽器下載網頁資料
Selenium
RSelenium: Basics
Chromedriver vs. Chrome update incompatibility

  • 版權聲明: 本部落格所有文章除有特別聲明外,均採用 Apache License 2.0 許可協議。轉載請註明出處!
  • © 2020-2024 John Doe
  • Powered by Hexo Theme Ayer
  • PV: UV: