當(dāng)下軟件園 / 匯聚當(dāng)下最新最酷的軟件下載站!
當(dāng)下軟件園
您的位置: 首頁 > 應(yīng)用軟件 > 編程工具 > Crawlab(分布式爬蟲管理軟件) V0.5.1 官方版
Crawlab Crawlab(分布式爬蟲管理軟件) V0.5.1 官方版 版本
  • 軟件大?。?/span>1.08M
  • 軟件語言:簡體中文
  • 軟件類型:國產(chǎn)軟件
  • 軟件授權(quán):免費(fèi)軟件
  • 更新時(shí)間:2020-09-30
  • 軟件類別:編程工具
  • 軟件官網(wǎng):http://hanheng168.com
  • 應(yīng)用平臺:Win2003,WinXP,Vista,Win7,Win8

網(wǎng)友評分: 分?jǐn)?shù) 5

軟件非常好(50% 軟件不好用(50%

  Crawlab是基于Golang的分布式爬蟲管理平臺,支持Python、NodeJS、Go、Java、PHP等多種編程語言以及多種爬蟲框架,分為Docker、直接部署、Kubernetes三種安裝方式!

Crawlab

【功能介紹】

  Crawlab架構(gòu):Crawlab的架構(gòu)包括了一個(gè)主節(jié)點(diǎn)(Master Node)和多個(gè)工作節(jié)點(diǎn)(Worker Node),以及負(fù)責(zé)通信和數(shù)據(jù)儲存的Redis和MongoDB數(shù)據(jù)庫。

  前端應(yīng)用向主節(jié)點(diǎn)請求數(shù)據(jù),主節(jié)點(diǎn)通過MongoDB和Redis來執(zhí)行任務(wù)派發(fā)調(diào)度以及部署,工作節(jié)點(diǎn)收到任務(wù)之后,開始執(zhí)行爬蟲任務(wù),并將任務(wù)結(jié)果儲存到MongoDB。架構(gòu)相對于v0.3.0之前的Celery版本有所精簡,去除了不必要的節(jié)點(diǎn)監(jiān)控模塊Flower,節(jié)點(diǎn)監(jiān)控主要由Redis完成。

  主節(jié)點(diǎn):主節(jié)點(diǎn)是整個(gè)Crawlab架構(gòu)的核心,屬于Crawlab的中控系統(tǒng)。主節(jié)點(diǎn)負(fù)責(zé)與前端應(yīng)用進(jìn)行通信,并通過Redis將爬蟲任務(wù)派發(fā)給工作節(jié)點(diǎn)。同時(shí),主節(jié)點(diǎn)會同步(部署)爬蟲給工作節(jié)點(diǎn),通過Redis和MongoDB的GridFS。

Crawlab

  工作節(jié)點(diǎn):工作節(jié)點(diǎn)的主要功能是執(zhí)行爬蟲任務(wù)和儲存抓取數(shù)據(jù)與日志,并且通過Redis的PubSub跟主節(jié)點(diǎn)通信。通過增加工作節(jié)點(diǎn)數(shù)量,Crawlab可以做到橫向擴(kuò)展,不同的爬蟲任務(wù)可以分配到不同的節(jié)點(diǎn)上執(zhí)行。

  MongoDB:MongoDB是Crawlab的運(yùn)行數(shù)據(jù)庫,儲存有節(jié)點(diǎn)、爬蟲、任務(wù)、定時(shí)任務(wù)等數(shù)據(jù),另外GridFS文件儲存方式是主節(jié)點(diǎn)儲存爬蟲文件并同步到工作節(jié)點(diǎn)的中間媒介。

  Redis:Redis是非常受歡迎的Key-Value數(shù)據(jù)庫,在Crawlab中主要實(shí)現(xiàn)節(jié)點(diǎn)間數(shù)據(jù)通信的功能。例如,節(jié)點(diǎn)會將自己信息通過HSET儲存在Redis的nodes哈希列表中,主節(jié)點(diǎn)根據(jù)哈希列表來判斷在線節(jié)點(diǎn)。

  前端:前端是一個(gè)基于Vue-Element-Admin的單頁應(yīng)用。其中重用了很多Element-UI的控件來支持相應(yīng)的展示。

軟件特別說明

標(biāo)簽: Crawlab

其他版本下載
相關(guān)文章
網(wǎng)友評論
回頂部 去下載

關(guān)于本站|下載幫助|下載聲明|軟件發(fā)布|聯(lián)系我們

Copyright ? 2005-2024 hanheng168.com.All rights reserved.

浙ICP備06019006號-1 浙公網(wǎng)安備33038102330474號