內容說明
主要是透過 Rselenium 來模擬人類打開網頁並對其進行操作,以下是一些 Rselenium 下載的教學步驟
安裝 Rselenium
1 | install.packages("RSelenium") |
安裝 WebDriver
Step 1:
由於我們安裝好 Selenium 後,Selenium 是程式語言與 browser 溝通的關鍵,於是我們還需要安裝一個機器人專用的瀏覽器來給他進行操控,目前支持機器人操控瀏覽器的有 Google Chrome and Firefox
首先先去這裡,找到目前最新的 Selenium Server 版本,作者在寫此文章時是這個版本。
如果電腦沒有 java 必須先去下載 java 才能安裝成功,建議可以將命令先 cd 至爬蟲資料夾
1 |
Step 2:
下一步則是我們要將 Google Chrome 專用的瀏覽器進行下載,先在 R console 中輸入
1 | binman::list_versions("chromedriver") |
應該要能夠出現,以下的感覺
1 | "85.0.4183.87" "86.0.4240.22" "87.0.4280.20" |
接著去此網站,下載最適合的版本,並放入你寫程式的資料夾內,建議放入與上述 selenium-server-standalone-X.XXX.XX.jar
相同位置
參考連結
RSelenium:R 使用 Selenium 操控瀏覽器下載網頁資料
Selenium
RSelenium: Basics
Chromedriver vs. Chrome update incompatibility