職位描述:
1、負(fù)責(zé)設(shè)計(jì)和開發(fā)分布式網(wǎng)絡(luò)爬蟲系統(tǒng),進(jìn)行數(shù)據(jù)抓取和分析;
2、設(shè)計(jì)爬蟲策略和防屏蔽規(guī)則,提升網(wǎng)頁抓取的效率和質(zhì)量;
3、參與分布式爬蟲和數(shù)據(jù)采集系統(tǒng)的架構(gòu)設(shè)計(jì)和開發(fā),快速響應(yīng)業(yè)務(wù)變動(dòng);
4、負(fù)責(zé)網(wǎng)絡(luò)數(shù)據(jù)抓取規(guī)劃、定期爬取指定網(wǎng)站的數(shù)據(jù);
5、參與數(shù)據(jù)層建設(shè),專注于垂直領(lǐng)域數(shù)據(jù)爬取,進(jìn)行多平臺(tái)信息的抓取和分析;
6、實(shí)現(xiàn)數(shù)據(jù)提取、清洗、結(jié)構(gòu)化、入庫、統(tǒng)計(jì)分析等需求;
7、研究優(yōu)化算法,提升爬蟲系統(tǒng)的穩(wěn)定性、可擴(kuò)展性。
任職要求:
1、本科及以上學(xué)歷,5年以上爬蟲抓取采集相關(guān)工作經(jīng)驗(yàn),爬蟲基礎(chǔ)扎實(shí);
2、熟練Python和常用的開源庫,熟練使用Django/Flask等至少一種主流的web開發(fā)框架;
3、熟練Mysql,MongoDB, Redis,Es,隊(duì)列等數(shù)據(jù)庫的使用和優(yōu)化;
4、對(duì)進(jìn)程、線程、協(xié)程、異步、非阻塞有一定了解和使用;
5、熟練掌握爬蟲主流框架Scrapy、Selenium、gocolly,webmagic等(深入了解其中一種);
6、熟悉應(yīng)用IP代理池、Headers認(rèn)證和Cookie等;
7、熟悉分布式爬蟲,JS防護(hù)、混淆、逆向分析等技能,熟悉各種瀏覽器檢測/反檢測手段;
8、熟悉Python/Java/Go/C++其中一種語言,具備扎實(shí)的編碼能力;
9、責(zé)任心強(qiáng)、工作積極、良好的服務(wù)意識(shí)、較強(qiáng)的工作適應(yīng)能力,自我驅(qū)動(dòng);
10、加分項(xiàng):逆向、分布式、數(shù)據(jù)分析、數(shù)據(jù)挖掘;有訓(xùn)練過自己的模型;github或者碼云有相關(guān)開源項(xiàng)目;有海量代理池搭建經(jīng)驗(yàn);有采集政府網(wǎng)址經(jīng)驗(yàn)優(yōu)先考慮;
1、負(fù)責(zé)設(shè)計(jì)和開發(fā)分布式網(wǎng)絡(luò)爬蟲系統(tǒng),進(jìn)行數(shù)據(jù)抓取和分析;
2、設(shè)計(jì)爬蟲策略和防屏蔽規(guī)則,提升網(wǎng)頁抓取的效率和質(zhì)量;
3、參與分布式爬蟲和數(shù)據(jù)采集系統(tǒng)的架構(gòu)設(shè)計(jì)和開發(fā),快速響應(yīng)業(yè)務(wù)變動(dòng);
4、負(fù)責(zé)網(wǎng)絡(luò)數(shù)據(jù)抓取規(guī)劃、定期爬取指定網(wǎng)站的數(shù)據(jù);
5、參與數(shù)據(jù)層建設(shè),專注于垂直領(lǐng)域數(shù)據(jù)爬取,進(jìn)行多平臺(tái)信息的抓取和分析;
6、實(shí)現(xiàn)數(shù)據(jù)提取、清洗、結(jié)構(gòu)化、入庫、統(tǒng)計(jì)分析等需求;
7、研究優(yōu)化算法,提升爬蟲系統(tǒng)的穩(wěn)定性、可擴(kuò)展性。
任職要求:
1、本科及以上學(xué)歷,5年以上爬蟲抓取采集相關(guān)工作經(jīng)驗(yàn),爬蟲基礎(chǔ)扎實(shí);
2、熟練Python和常用的開源庫,熟練使用Django/Flask等至少一種主流的web開發(fā)框架;
3、熟練Mysql,MongoDB, Redis,Es,隊(duì)列等數(shù)據(jù)庫的使用和優(yōu)化;
4、對(duì)進(jìn)程、線程、協(xié)程、異步、非阻塞有一定了解和使用;
5、熟練掌握爬蟲主流框架Scrapy、Selenium、gocolly,webmagic等(深入了解其中一種);
6、熟悉應(yīng)用IP代理池、Headers認(rèn)證和Cookie等;
7、熟悉分布式爬蟲,JS防護(hù)、混淆、逆向分析等技能,熟悉各種瀏覽器檢測/反檢測手段;
8、熟悉Python/Java/Go/C++其中一種語言,具備扎實(shí)的編碼能力;
9、責(zé)任心強(qiáng)、工作積極、良好的服務(wù)意識(shí)、較強(qiáng)的工作適應(yīng)能力,自我驅(qū)動(dòng);
10、加分項(xiàng):逆向、分布式、數(shù)據(jù)分析、數(shù)據(jù)挖掘;有訓(xùn)練過自己的模型;github或者碼云有相關(guān)開源項(xiàng)目;有海量代理池搭建經(jīng)驗(yàn);有采集政府網(wǎng)址經(jīng)驗(yàn)優(yōu)先考慮;
職位類別: 軟件工程師
舉報(bào)
全選
申請(qǐng)職位
-
5K/月申請(qǐng)職位1、本科以上學(xué)歷,計(jì)算機(jī)和軟件相關(guān)專業(yè) 2、加分項(xiàng):熟悉Python或Java語言,了解逆向、分布式、大數(shù)據(jù)分析、數(shù)據(jù)挖掘;有訓(xùn)練過自己的模型;github或者碼云有相關(guān)開源項(xiàng)目;有海量代理池搭建經(jīng)驗(yàn)
-
15-25K/月申請(qǐng)職位崗位要求: 1.對(duì)爬蟲、圖形驗(yàn)證碼識(shí)別等技術(shù)有較深入研究 2. 計(jì)算機(jī)或相關(guān)專業(yè)??埔陨蠈W(xué)歷,3年以上爬蟲工作經(jīng)驗(yàn) 3. 掌握網(wǎng)絡(luò)爬蟲開發(fā)原理,對(duì)互聯(lián)網(wǎng)各種類型數(shù)據(jù)交互模式數(shù)據(jù),知道如何處理需登..
-
面議申請(qǐng)職位1、本科以上學(xué)歷,計(jì)算機(jī)和軟件相關(guān)專業(yè)2、加分項(xiàng):熟悉Python或Java語言,了解逆向、分布式、大數(shù)據(jù)分析、數(shù)據(jù)挖掘;有訓(xùn)練過自己的模型;github或者碼云有相關(guān)開源項(xiàng)目;有海量代理池搭建經(jīng)驗(yàn)。
-
8-10/月申請(qǐng)職位崗位職責(zé):1、負(fù)責(zé)設(shè)計(jì)和開發(fā)分布式網(wǎng)絡(luò)爬蟲系統(tǒng),進(jìn)行多平臺(tái)信息的抓取和分析;2、負(fù)責(zé)網(wǎng)頁信息抽取、數(shù)據(jù)清洗等研發(fā)和優(yōu)化工作;。任職資格:1、具有1年以上爬蟲相關(guān)經(jīng)驗(yàn),熟悉驗(yàn)證碼破解,動(dòng)態(tài)IP..
-
8-12K/月申請(qǐng)職位1.負(fù)責(zé)爬蟲軟件工具和爬蟲技術(shù)的選??; 2.負(fù)責(zé)爬蟲采集器設(shè)計(jì)、開發(fā)、優(yōu)化; 3.實(shí)現(xiàn)各種互聯(lián)網(wǎng)來源的數(shù)據(jù)標(biāo)準(zhǔn)化處理入庫。 任職要求 1.本科及以上學(xué)歷,能力優(yōu)秀者可放寬到大專學(xué)歷;..
-
8-12K/月申請(qǐng)職位職位描述: 1、互聯(lián)網(wǎng)站,網(wǎng)頁,鏈接的特征挖掘 ,對(duì)指定的多個(gè)網(wǎng)站的網(wǎng)頁進(jìn)行網(wǎng)頁抓取、數(shù)據(jù)的提取、清洗、入庫; 2、對(duì)搜索、匹配、同步等后臺(tái)守護(hù)程序進(jìn)行性能優(yōu)化等; 3、負(fù)責(zé)系統(tǒng)日常運(yùn)營資源..
-
1-2/月申請(qǐng)職位★美至的使命: 用數(shù)據(jù)賦能零售和連鎖服務(wù)行業(yè)的增長與變革?!镂覀兊膱F(tuán)隊(duì): 我們的創(chuàng)始人是資深的風(fēng)險(xiǎn)投資人,聚焦美妝、零售、連鎖服務(wù)及科技領(lǐng)域; 我們的團(tuán)隊(duì)具有豐富的跨行業(yè)經(jīng)驗(yàn):頂尖互聯(lián)..
-
面議申請(qǐng)職位1、設(shè)計(jì)和開發(fā)分布式網(wǎng)絡(luò)爬蟲系統(tǒng),進(jìn)行多平臺(tái)信息抓取和分析工作。2、負(fù)責(zé)完成網(wǎng)站數(shù)據(jù)采集爬取、解析提取、清洗入庫等數(shù)據(jù)生產(chǎn)工作。3、設(shè)計(jì)爬蟲策略和防屏蔽規(guī)則,提升網(wǎng)頁抓取的效率和質(zhì)量。4、..
- 公司規(guī)模:100 - 499人
- 公司性質(zhì):民營企業(yè)
- 所屬行業(yè):網(wǎng)絡(luò)產(chǎn)品開發(fā)
- 所在地區(qū):
- 聯(lián)系人:姜女士
- 手機(jī):會(huì)員登錄后才可查看
- 郵箱:會(huì)員登錄后才可查看
- 郵政編碼:
工作地址
- 地址:深圳市南山區(qū)粵海街道高新區(qū)社區(qū)高新南九道6號(hào)深圳灣科技生態(tài)園6棟506






