八爪魚如何采集亞馬遜商品

  

八爪魚是常用的采集軟件之一,做亞馬遜時也是會經常用到的,今天一米軟件就來教教大家八爪魚如何采集亞馬遜商品。


步驟1:創建采集任務


1)進入主界面,選擇“自定義采集”


八爪魚如何采集亞馬遜商品


2)將要采集的網站URL復制粘貼到輸入框中,點擊“保存網址”


八爪魚如何采集亞馬遜商品


步驟2:創建翻頁循環


1)將頁面下拉到底部,點擊“1-20“,然后在右側的提示框中選擇“選中全部”


八爪魚如何采集亞馬遜商品


2)然后在右側的操作提示框中,選擇“循環點擊每個鏈接”


八爪魚如何采集亞馬遜商品


步驟3:提取商品信息


1)移動鼠標,選中頁面里的第一條商品內容,選中后,評價框會變成綠色,其中的字段會變為紅色底色。選擇右側操作提示框中的“選中子元素”


八爪魚如何采集亞馬遜商品


2)之后接著選擇“選中全部”


八爪魚如何采集亞馬遜商品


步驟4:Ajax點擊


1)因為該網使用了Ajax技術腳本,所以我們在“點擊元素”時候,可以設置AJax點擊加載,如下圖,鼠標先點擊左邊流程規則中的“點擊元素”,然后打開高級選項進行設置,在AJax加載一項中勾選AJax加載數據,超時2秒,


八爪魚如何采集亞馬遜商品


注:AJAX即延時加載、異步更新的一種腳本技術,通過在后臺與服務器進行少量數據交換,可以在不重新加載整個網頁的情況下,對網頁的某部分進行更新。


表現特征:1、點擊網頁中某個選項時,大部分網站的網址不會改變;2網頁不是完全加載,只是局部進行了數據加載,有所變化


如何驗證:點擊操作后,在瀏覽器中,網址輸入欄不會出現加載中的狀態或者轉圈狀態。


步驟5:修改Xpath


點擊左上角的“保存并啟動”,選擇“啟動本地采集”。采集過程中我們發現,采集的數據出現大量重復。手動運行檢查整個采集流程,我們發現在翻頁循環的時候,數據并沒有定位到下一頁。所以需要修改Xpath


1)選擇第一個“循環”步驟,打開高級選項,查看固定元素列表文本,可以看到第一條和后面的格式不一樣,所以參照后面的對第一條的格式進行修改


八爪魚如何采集亞馬遜商品


2)修改以后,文本列表如下圖


八爪魚如何采集亞馬遜商品


3)然后選擇“保存并啟動”,啟動本地采集,再次采集數據


八爪魚如何采集亞馬遜商品


步驟5:數據采集及導出


1)采集完成后,會跳出提示,選擇“導出數據”選擇“合適的導出方式”,將采集好的數據導出


八爪魚如何采集亞馬遜商品


2)這里我們選擇excel作為導出為格式


八爪魚如何采集亞馬遜商品


導出后的數據如下圖


八爪魚如何采集亞馬遜商品


如果想要更方便、更快捷的采集亞馬遜商品信息可以使用一米亞馬遜采集軟件來幫助自己,簡單設置之后即可一鍵采集。

相關資訊