網(wǎng)友評(píng)分: 9.4分
后羿采集器是一款專業(yè)實(shí)用的的網(wǎng)頁(yè)數(shù)據(jù)采集器。這款采集器不需要開(kāi)發(fā),任何人都能用,基于人工智能技術(shù),只需輸入網(wǎng)址就能自動(dòng)識(shí)別采集內(nèi)容,數(shù)據(jù)可導(dǎo)出到本地文件、發(fā)布到網(wǎng)站和數(shù)據(jù)庫(kù)等。
它由原Google技術(shù)團(tuán)隊(duì)傾力打造,其規(guī)則配置簡(jiǎn)單,采集功能強(qiáng)大,能夠支持電商類、生活服務(wù)類、社交媒體、新聞?wù)搲炔煌愋偷木W(wǎng)站,智能識(shí)別網(wǎng)頁(yè)數(shù)據(jù),導(dǎo)出數(shù)據(jù)方式多樣,最主要是完全免費(fèi),是行業(yè)分析、精準(zhǔn)營(yíng)銷、品牌監(jiān)控、風(fēng)險(xiǎn)預(yù)估的好幫手。
后羿免費(fèi)采集器支持所有操作系統(tǒng)版本更新和功能升級(jí)同步所有平臺(tái),采集和導(dǎo)出全免費(fèi),無(wú)限制放心用,并支持后臺(tái)運(yùn)行,不打擾您的其他前臺(tái)工作,是你數(shù)據(jù)采集最好的助手。
一、【規(guī)則配置簡(jiǎn)單 采集功能強(qiáng)大】
1、可視化自定義采集流程:
全程問(wèn)答式引導(dǎo)、可視化操作、自定義采集流程
自動(dòng)記錄和模擬網(wǎng)頁(yè)操作順序
高級(jí)設(shè)置滿足更多采集需求
2、點(diǎn)選抽取網(wǎng)頁(yè)數(shù)據(jù):
鼠標(biāo)點(diǎn)擊選擇要爬取的網(wǎng)頁(yè)內(nèi)容、操作簡(jiǎn)單
可選擇抽取文本、鏈接、屬性、html標(biāo)簽等
3、運(yùn)行批量采集數(shù)據(jù):
軟件按照采集流程和抽取規(guī)則自動(dòng)批量采集
快速穩(wěn)定,實(shí)時(shí)顯示采集速度和過(guò)程
可切換軟件后臺(tái)運(yùn)行,不打擾前臺(tái)工作
4、導(dǎo)出和發(fā)布采集的數(shù)據(jù):
采集的數(shù)據(jù)自動(dòng)表格化,自由配置字段
支持?jǐn)?shù)據(jù)導(dǎo)出到Excel等本地文件
和一鍵發(fā)布到CMS網(wǎng)站/數(shù)據(jù)庫(kù)/微信公眾號(hào)等媒體
二、【支持采集不同類型的網(wǎng)站】
電商類、生活服務(wù)類、社交媒體、新聞?wù)搲?、地方網(wǎng)站......
強(qiáng)大瀏覽器內(nèi)核,99%以上網(wǎng)站都能采!
三、【全平臺(tái)支持 全免費(fèi) 可視化操作】
支持所有操作系統(tǒng):Windows+Mac+Linux
采集和導(dǎo)出全免費(fèi),無(wú)限制放心用
可視化配置采集規(guī)則,傻瓜式操作
四、【功能強(qiáng)大,箭速迭】
智能識(shí)別網(wǎng)頁(yè)數(shù)據(jù),導(dǎo)出數(shù)據(jù)方式多樣
軟件定期更新升級(jí),不斷添加新功能
客戶的滿意是對(duì)我們最大的肯定!
智能識(shí)別數(shù)據(jù),小白神器
智能模式:基于人工智能算法,只需輸入網(wǎng)址就能智能識(shí)別列表數(shù)據(jù)、表格數(shù)據(jù)和分頁(yè)按鈕,不需要配置任何采集規(guī)則,一鍵采集。
自動(dòng)識(shí)別:列表、表格、鏈接、圖片、價(jià)格、郵箱等
支持多種數(shù)據(jù)導(dǎo)出方式
采集結(jié)果可以導(dǎo)出到本地,支持TXT、EXCEL、CSV和HTML文件格式,也可以直接發(fā)布到數(shù)據(jù)庫(kù)(MySQL、MongoDB、SQL Server、PostgreSQL)和網(wǎng)站(Wordpress、Discuz等),提供豐富的發(fā)布插件供您使用。
可視化點(diǎn)擊,簡(jiǎn)單上手
流程圖模式:只需根據(jù)軟件提示在頁(yè)面中進(jìn)行點(diǎn)擊操作,完全符合人為瀏覽網(wǎng)頁(yè)的思維方式,簡(jiǎn)單幾步即可生成復(fù)雜的采集規(guī)則,結(jié)合智能識(shí)別算法,任何網(wǎng)頁(yè)的數(shù)據(jù)都能輕松采集。
可模擬操作: 輸入文本、點(diǎn)擊、移動(dòng)鼠標(biāo)、下拉框、滾動(dòng)頁(yè)面、等待加載、循環(huán)操作和判斷條件等。
功能強(qiáng)大,提供企業(yè)級(jí)服務(wù)
后羿采集器提供豐富的采集功能,無(wú)論是采集穩(wěn)定性或是采集效率,都能夠滿足個(gè)人、團(tuán)隊(duì)和企業(yè)級(jí)采集需求。
豐富的功能: 定時(shí)采集,智能防屏蔽,自動(dòng)導(dǎo)出,文件下載,加速引擎,按組啟動(dòng)和導(dǎo)出,Webhook,RESTful API,智能識(shí)別SKU和電商大圖等。
云端賬號(hào),方便快捷
創(chuàng)建后羿采集器賬號(hào)并登錄,您的所有采集任務(wù)都將自動(dòng)同步保存到后羿的云端服務(wù)器,無(wú)需擔(dān)心采集任務(wù)丟失。 后羿采集器對(duì)賬號(hào)沒(méi)有終端綁定限制,您切換終端時(shí)采集任務(wù)也會(huì)同步更新,任務(wù)管理方便快捷。
全平臺(tái)支持,無(wú)縫切換
同時(shí)支持Windows、Mac和Linux全操作系統(tǒng)的采集軟件,各平臺(tái)版本完全相同,無(wú)縫切換。
步驟一:登陸打開(kāi)后羿采集器軟件
步驟二:新建采集任務(wù)
1、復(fù)制網(wǎng)頁(yè)地址:需要采集評(píng)價(jià)的商品網(wǎng)址
2、新建流程圖模式采集任務(wù):導(dǎo)入采集規(guī)則來(lái)創(chuàng)建智能任務(wù)
步驟三:配置采集規(guī)則
1、設(shè)置預(yù)登陸
輸入網(wǎng)址后,我們進(jìn)入寶貝的詳情頁(yè),此時(shí)頁(yè)面上出現(xiàn)的登錄界面我們可以點(diǎn)擊關(guān)閉,不需要進(jìn)行登錄也能夠采集到評(píng)論數(shù)據(jù)。
2、設(shè)置數(shù)據(jù)字段
在詳情頁(yè)上可以看到評(píng)論數(shù)但是看不到具體的評(píng)論內(nèi)容,我們需要點(diǎn)擊評(píng)論,然后在左上角跳轉(zhuǎn)出來(lái)的提示框中選擇“點(diǎn)擊該元素”。
3、進(jìn)入到評(píng)論界面后,根據(jù)搜索的方向選擇元素,例如好評(píng)、差評(píng)等元素,我們可以在這個(gè)基礎(chǔ)上右擊字段進(jìn)行相關(guān)設(shè)置,包括修改字段名稱、增減字段、處理數(shù)據(jù)等。
由于我們想要下載全部的評(píng)論圖片,因此可以選中評(píng)論中的全部圖片,然后設(shè)置字段屬性—提取外部html。
4、我們采集出了單頁(yè)的評(píng)論數(shù)據(jù),現(xiàn)在需要采集下一頁(yè)的數(shù)據(jù),我們點(diǎn)擊頁(yè)面上的“下一頁(yè)”按鈕,在左上角出現(xiàn)的操作提示框內(nèi)選擇“循環(huán)點(diǎn)擊下一頁(yè)”。
步驟四:設(shè)置并啟動(dòng)采集任務(wù)
點(diǎn)擊“開(kāi)始采集”按鈕,可在彈出的啟動(dòng)設(shè)置頁(yè)面中進(jìn)行一些高級(jí)設(shè)置,包括“定時(shí)啟動(dòng)、防屏蔽、自動(dòng)導(dǎo)出、文件下載、加速引擎、數(shù)據(jù)去重、開(kāi)發(fā)者設(shè)置”功能,本次采集沒(méi)有使用這些功能,我們直接點(diǎn)擊啟動(dòng)開(kāi)始采集。
步驟五:導(dǎo)出并查看數(shù)據(jù)
數(shù)據(jù)采集完成后,我們可以查看和導(dǎo)出數(shù)據(jù),后羿采集器支持多種導(dǎo)出方式和導(dǎo)出文件的格式,同時(shí)還支持導(dǎo)出具體條數(shù),可以在數(shù)據(jù)中選擇想導(dǎo)出的條數(shù),然后點(diǎn)擊“確認(rèn)導(dǎo)出”。
1、導(dǎo)出前臺(tái)運(yùn)行任務(wù)的采集結(jié)果
如果采集任務(wù)在前臺(tái)運(yùn)行,在任務(wù)結(jié)束后軟件會(huì)彈出數(shù)據(jù)采集停止的提示框,此時(shí)我們點(diǎn)擊“導(dǎo)出數(shù)據(jù)”按鈕,即可導(dǎo)出采集數(shù)據(jù)結(jié)果。
2、導(dǎo)出后臺(tái)運(yùn)行任務(wù)的采集結(jié)果
如果采集任務(wù)在后臺(tái)運(yùn)行,在任務(wù)結(jié)束后,桌面右下角會(huì)彈出導(dǎo)出提示框,我們根據(jù)右下角任務(wù)完成的彈框提示打開(kāi)查看數(shù)據(jù)界面,或者導(dǎo)出數(shù)據(jù)。
3、導(dǎo)出已經(jīng)保存過(guò)的采集任務(wù)的采集結(jié)果
如果不是實(shí)時(shí)運(yùn)行的采集任務(wù),而是之前運(yùn)行過(guò)的采集任務(wù),例如我們關(guān)閉軟件之后又重新打開(kāi)軟件,然導(dǎo)出一個(gè)運(yùn)行過(guò)的采集任務(wù)的采集結(jié)果。
這種情況下我們可以右擊任務(wù)點(diǎn)擊“查看數(shù)據(jù)”打開(kāi)查看數(shù)據(jù)界面,然后在該界面設(shè)置導(dǎo)出數(shù)據(jù)。
4、導(dǎo)出數(shù)據(jù)的其他事項(xiàng)
目前后羿采集器支持多種格式免費(fèi)導(dǎo)出,包括:Excel2007、Excel2003、CSV、HTML文件、TXT文件;同時(shí)支持免費(fèi)導(dǎo)出到數(shù)據(jù)庫(kù)。
個(gè)人專業(yè)版及以上支持發(fā)布到網(wǎng)站,目前支持發(fā)布到WordPress、發(fā)布到Typecho、發(fā)布到DEDECMS(織夢(mèng)),更多網(wǎng)站模板繼續(xù)更新中……
用戶在導(dǎo)出數(shù)據(jù)時(shí),可以選擇導(dǎo)出范圍,可選擇導(dǎo)出未導(dǎo)出的數(shù)據(jù)、導(dǎo)出已選的數(shù)據(jù),或者選擇導(dǎo)出條數(shù)。
在導(dǎo)出結(jié)束后,還可以對(duì)導(dǎo)出的數(shù)據(jù)進(jìn)行標(biāo)記,這樣子就能明確的直觀的看到哪些數(shù)據(jù)是已經(jīng)導(dǎo)出過(guò)的,哪些數(shù)據(jù)是未導(dǎo)出過(guò)的。
第一種:逐個(gè)圖片添加
直接在頁(yè)面中點(diǎn)擊你想要下載的圖片,然后根據(jù)提示點(diǎn)擊“提取該元素”,軟件會(huì)自動(dòng)生成提取數(shù)據(jù)組件并添加一個(gè)圖片字段。(如果連續(xù)采集字段時(shí),不一定每次都會(huì)生成新的提取數(shù)據(jù)組價(jià),只會(huì)添加新的字段)
或者直接點(diǎn)擊“添加字段”,然后在頁(yè)面中點(diǎn)擊你想下載的圖片。
第二種:一次下載多個(gè)圖片
這種情況需要圖片集中在一起,可以一次框選所有圖片。
我們可以直接點(diǎn)擊點(diǎn)擊整個(gè)圖片區(qū)域的右下角,在框選時(shí)我們可以看到軟件的藍(lán)色框選區(qū)域,保證所有要下載的圖片都被框選到。然后根據(jù)提示點(diǎn)擊“提取該元素”,軟件會(huì)自動(dòng)生成提取數(shù)據(jù)組件并添加一個(gè)圖片字段。(如果連續(xù)采集字段時(shí),不一定每次都會(huì)生成新的提取數(shù)據(jù)組價(jià),只會(huì)添加新的字段)
然后右擊字段,修改字段屬性為“提取內(nèi)部HTML”。
點(diǎn)擊右下角“開(kāi)始采集”按鈕,可以設(shè)置圖片下載功能。
接下來(lái)我們只需點(diǎn)擊“開(kāi)始采集”,然后在啟動(dòng)框中勾選“采集中同時(shí)下載圖片至以下目錄”即可開(kāi)啟圖片下載功能,用戶可以設(shè)置圖片的本地保存路徑。
標(biāo)簽: 后羿采集器 網(wǎng)頁(yè)采集 數(shù)據(jù)采集
老樹(shù)大數(shù)據(jù)采集大師 V1.2.8 試用版 42.14M | 簡(jiǎn)體中文 | 10
詳情展翅網(wǎng)店數(shù)據(jù)采集軟件 V3.8 試用版 1.16M | 簡(jiǎn)體中文 | 8
詳情通用稅務(wù)數(shù)據(jù)采集軟件 V2.4 官方免費(fèi)版 2.13M | 簡(jiǎn)體中文 | 7.1
詳情NI-DAQmx破解版 V19.0 免費(fèi)版 3.58G | 簡(jiǎn)體中文 | 4.7
詳情簡(jiǎn)數(shù)采集器助手 V1.20 官方最新版 62.05M | 簡(jiǎn)體中文 | 10
詳情旺參謀插件 V0.0.0.12 官方版 840K | 簡(jiǎn)體中文 | 9.1
詳情關(guān)于本站|下載幫助|下載聲明|軟件發(fā)布|聯(lián)系我們
Copyright ? 2005-2024 hanheng168.com.All rights reserved.
浙ICP備2024132706號(hào)-1 浙公網(wǎng)安備33038102330474號(hào)