當下軟件園 / 匯聚當下最新最酷的軟件下載站!
當下軟件園
您的位置: 首頁 > 網(wǎng)絡軟件 > 瀏覽輔助 > LocoySpider(火車采集器) V9.12 官方版
LocoySpider LocoySpider(火車采集器) V9.12 官方版 版本
  • 軟件大?。?/span>30.1M
  • 軟件語言:簡體中文
  • 軟件類型:國產(chǎn)軟件
  • 軟件授權:免費軟件
  • 更新時間:2019-12-27
  • 軟件類別:瀏覽輔助
  • 軟件官網(wǎng):http://www.hanheng168.com
  • 應用平臺:Win2003,WinXP,Vista,Win7,Win8

網(wǎng)友評分: 分數(shù) 5

軟件非常好(50% 軟件不好用(50%

  LocoySpider是一款非常專業(yè)的數(shù)據(jù)采集軟件,該軟件功能強大,為廣大用戶提供了網(wǎng)絡數(shù)據(jù)采集以及信息挖掘等功能,有了它,我們可以通過靈活的方式輕松的從網(wǎng)頁上抓取文字、圖片、文件等任何數(shù)據(jù)。

  程序支持遠程下載圖片文件,支持網(wǎng)站登陸后的信息獲取,支持探測文件真實地址,支持代理,支持防盜鏈的采集,支持采集數(shù)據(jù)直接入庫和模仿人手工發(fā)布等許多功能特點。

LocoySpider

【軟件特色】

  1、規(guī)則自定義 - 通過采集規(guī)則的定義,可以搜索所有網(wǎng)站采集幾乎任何類型的信息。

  2、多任務,多線程 - 可以同時進行多個信息獲取任務,每個任務可以使用多個線程。

  3、所見即所得 - 任務采集過程所見即所得,過程中遍歷的鏈接信息、采集信息、錯誤信息等都會及時的反映在軟件界面中。

  4、數(shù)據(jù)保存 - 數(shù)據(jù)邊采集邊自動保存到關系數(shù)據(jù)庫中,并且數(shù)據(jù)結構能夠自動適應,軟件可以根據(jù)采集規(guī)則自動創(chuàng)建數(shù)據(jù)庫,以及其中的表和字段,也可以通過導庫方式靈活的將數(shù)據(jù)保存到客戶已有的數(shù)據(jù)庫結構中。

  5、斷點續(xù)采 - 信息收集任務可以在停止后從斷點開始繼續(xù)采集,從此你用不再擔心你的采集任務意外中斷了。

  6、網(wǎng)站登錄 - 支持網(wǎng)站Cookie,支持網(wǎng)站可視化登錄,即使登錄時需要驗證碼的網(wǎng)站也能采集。

  7、計劃任務 - 通過這個功能可以讓你的采集任務定時、定量或者一直循環(huán)執(zhí)行。

  8、采集范圍限制 - 可以根據(jù)采集的深度和網(wǎng)址的標識來限制采集的范圍。

  9、文件下載 - 可以將采集到的二進制文件(諸如:圖片、音樂、軟件、文檔等等)下載到本地磁盤或者采集結果數(shù)據(jù)庫中。

  10、結果替換 - 可以將采集的結果根據(jù)規(guī)則替換成你定義的內容。

  11、條件保存 - 可以根據(jù)某個條件來決定那些信息保存,那些信息過濾。

  12、過濾重復內容 - 軟件可根據(jù)用戶設置和實際情況對重復內容和重復網(wǎng)址自動刪除重復內容。

  13、特殊鏈接識別 - 運用此功能可以將用JavaScript動態(tài)生成的鏈接或其他更古怪的連接識別出來。

  14、數(shù)據(jù)發(fā)布 - 可以通過自定義接口,將已采集的結果數(shù)據(jù)發(fā)布到任意的內容管理系統(tǒng)和指定數(shù)據(jù)庫中?,F(xiàn)在已支持的目標發(fā)布媒體包括:數(shù)據(jù)庫(access, sql server,my sql,oracle) ,靜態(tài)htm文件。

  15、預留編程接口 - 定義多個編程接口,用戶可以在事件中利用PHP,C#語言進行編程,擴充采集功能。

LocoySpider

【功能介紹】

  1、支持所有網(wǎng)站編碼:完美支持采集所有編碼格式的網(wǎng)頁,程序還可以自動識別網(wǎng)頁編碼。

  2、多種發(fā)布方式:支持目前所有主流和非主流的CMS,BBS等網(wǎng)站程序,通過系統(tǒng)的發(fā)布模塊能實現(xiàn)采集器和網(wǎng)站程序間的完美結合。

  3、全自動:無人值守工作,配置好程序后,程序將依據(jù)您的設置自動運行,完全無需人工干預。

  4、本地編輯:本地可視化編輯已采集的數(shù)據(jù)。

  5、采集測試:這是其它任何同類采集軟件所不能比的,程序支持直接查看采集結果并測試發(fā)布。

  6、管理方便:使用站點+任務方式管理采集節(jié)點,任務支持批量操作,再多的數(shù)據(jù)管理也很輕松。

【更新日志】

  1、 列表頁新增“地址處理”功能

  內容替換/排重

  可以對網(wǎng)址中內容進行替換,且替換完成后,重復的網(wǎng)址會自動去重。

  純正則替換

  可以使用正則表達式進行匹配,和內容替換功能類似

  字符編碼處理

  網(wǎng)址中有需要轉碼的內容,比如采到的鏈接里有 & 可以進行解碼

  2、新增“請求失敗數(shù)”的預警條件設置

  3、下載圖片命名,新增[記錄自增Id]格式

  記錄自增ID:同一個內容頁中,多個標簽設置記錄自增ID,那么多個標簽都是從1開始自增,再次測試運行又會重新開始從1自增,更換個內容頁測試運行,也是從1開始自增。

  自增ID:設置自增ID是采集器啟動后運行,開始一個自增ID,從1開始自增,之后就是自增。重啟采集器后,又會重新開始自增ID,從1開始自增。

  4、修復圖片下載誤判斷問題

  5、修復計劃任務中“每天調度”,起始運行時間配置未生效的問題

  6、 修復PHP插件,對于循環(huán)記錄的處理報錯的問題

  7、修復拼音首字母對于一些錯誤字符的判斷問題

  8、任務批量編輯,修復“發(fā)布”中“多網(wǎng)站亂序發(fā)布”未能復制的問題

  9、修改“循環(huán)添加新記錄”配置后,修復數(shù)據(jù)格式選擇錯誤的問題

  10、修復循環(huán)記錄中列表頁標簽被多次處理的問題

  11、修復對于一些302跳轉地址,無法正確跳轉的問題

  12、修復一些網(wǎng)址無法正確請求的問題

軟件特別說明

標簽: LocoySpider 火車采集器 數(shù)據(jù)采集 信息采集

其他版本下載
網(wǎng)友評論
回頂部 去下載

關于本站|下載幫助|下載聲明|軟件發(fā)布|聯(lián)系我們

Copyright ? 2005-2024 www.hanheng168.com.All rights reserved.

浙ICP備06019006號-1 浙公網(wǎng)安備33038102330474號