職位描述:
1、負(fù)責(zé)設(shè)計和開發(fā)分布式網(wǎng)絡(luò)爬蟲系統(tǒng),進(jìn)行數(shù)據(jù)抓取和分析;
2、設(shè)計爬蟲策略和防屏蔽規(guī)則,提升網(wǎng)頁抓取的效率和質(zhì)量;
3、參與分布式爬蟲和數(shù)據(jù)采集系統(tǒng)的架構(gòu)設(shè)計和開發(fā),快速響應(yīng)業(yè)務(wù)變動;
4、負(fù)責(zé)網(wǎng)絡(luò)數(shù)據(jù)抓取規(guī)劃、定期爬取指定網(wǎng)站的數(shù)據(jù);
5、參與數(shù)據(jù)層建設(shè),專注于垂直領(lǐng)域數(shù)據(jù)爬取,進(jìn)行多平臺信息的抓取和分析;
6、實現(xiàn)數(shù)據(jù)提取、清洗、結(jié)構(gòu)化、入庫、統(tǒng)計分析等需求;
7、研究優(yōu)化算法,提升爬蟲系統(tǒng)的穩(wěn)定性、可擴展性。
任職要求:
1、本科及以上學(xué)歷,5年以上爬蟲抓取采集相關(guān)工作經(jīng)驗,爬蟲基礎(chǔ)扎實;
2、熟練Python和常用的開源庫,熟練使用Django/Flask等至少一種主流的web開發(fā)框架;
3、熟練Mysql,MongoDB, Redis,Es,隊列等數(shù)據(jù)庫的使用和優(yōu)化;
4、對進(jìn)程、線程、協(xié)程、異步、非阻塞有一定了解和使用;
5、熟練掌握爬蟲主流框架Scrapy、Selenium、gocolly,webmagic等(深入了解其中一種);
6、熟悉應(yīng)用IP代理池、Headers認(rèn)證和Cookie等;
7、熟悉分布式爬蟲,JS防護(hù)、混淆、逆向分析等技能,熟悉各種瀏覽器檢測/反檢測手段;
8、熟悉Python/Java/Go/C++其中一種語言,具備扎實的編碼能力;
9、責(zé)任心強、工作積極、良好的服務(wù)意識、較強的工作適應(yīng)能力,自我驅(qū)動;
10、加分項:逆向、分布式、數(shù)據(jù)分析、數(shù)據(jù)挖掘;有訓(xùn)練過自己的模型;github或者碼云有相關(guān)開源項目;有海量代理池搭建經(jīng)驗;有采集政府網(wǎng)址經(jīng)驗優(yōu)先考慮;
1、負(fù)責(zé)設(shè)計和開發(fā)分布式網(wǎng)絡(luò)爬蟲系統(tǒng),進(jìn)行數(shù)據(jù)抓取和分析;
2、設(shè)計爬蟲策略和防屏蔽規(guī)則,提升網(wǎng)頁抓取的效率和質(zhì)量;
3、參與分布式爬蟲和數(shù)據(jù)采集系統(tǒng)的架構(gòu)設(shè)計和開發(fā),快速響應(yīng)業(yè)務(wù)變動;
4、負(fù)責(zé)網(wǎng)絡(luò)數(shù)據(jù)抓取規(guī)劃、定期爬取指定網(wǎng)站的數(shù)據(jù);
5、參與數(shù)據(jù)層建設(shè),專注于垂直領(lǐng)域數(shù)據(jù)爬取,進(jìn)行多平臺信息的抓取和分析;
6、實現(xiàn)數(shù)據(jù)提取、清洗、結(jié)構(gòu)化、入庫、統(tǒng)計分析等需求;
7、研究優(yōu)化算法,提升爬蟲系統(tǒng)的穩(wěn)定性、可擴展性。
任職要求:
1、本科及以上學(xué)歷,5年以上爬蟲抓取采集相關(guān)工作經(jīng)驗,爬蟲基礎(chǔ)扎實;
2、熟練Python和常用的開源庫,熟練使用Django/Flask等至少一種主流的web開發(fā)框架;
3、熟練Mysql,MongoDB, Redis,Es,隊列等數(shù)據(jù)庫的使用和優(yōu)化;
4、對進(jìn)程、線程、協(xié)程、異步、非阻塞有一定了解和使用;
5、熟練掌握爬蟲主流框架Scrapy、Selenium、gocolly,webmagic等(深入了解其中一種);
6、熟悉應(yīng)用IP代理池、Headers認(rèn)證和Cookie等;
7、熟悉分布式爬蟲,JS防護(hù)、混淆、逆向分析等技能,熟悉各種瀏覽器檢測/反檢測手段;
8、熟悉Python/Java/Go/C++其中一種語言,具備扎實的編碼能力;
9、責(zé)任心強、工作積極、良好的服務(wù)意識、較強的工作適應(yīng)能力,自我驅(qū)動;
10、加分項:逆向、分布式、數(shù)據(jù)分析、數(shù)據(jù)挖掘;有訓(xùn)練過自己的模型;github或者碼云有相關(guān)開源項目;有海量代理池搭建經(jīng)驗;有采集政府網(wǎng)址經(jīng)驗優(yōu)先考慮;
職位類別: 軟件工程師
舉報
水工工程師職業(yè)大全:

全選
申請職位
-
5千/月申請職位1、本科以上學(xué)歷,計算機和軟件相關(guān)專業(yè) 2、加分項:熟悉Python或Java語言,了解逆向、分布式、大數(shù)據(jù)分析、數(shù)據(jù)挖掘;有訓(xùn)練過自己的模型;github或者碼云有相關(guān)開源項目;有海量代理池搭建經(jīng)驗
-
面議申請職位1、本科以上學(xué)歷,計算機和軟件相關(guān)專業(yè)2、加分項:熟悉Python或Java語言,了解逆向、分布式、大數(shù)據(jù)分析、數(shù)據(jù)挖掘;有訓(xùn)練過自己的模型;github或者碼云有相關(guān)開源項目;有海量代理池搭建經(jīng)驗。
- 公司規(guī)模:100 - 499人
- 公司性質(zhì):民營企業(yè)
- 所屬行業(yè):網(wǎng)絡(luò)產(chǎn)品開發(fā)
- 所在地區(qū):
- 聯(lián)系人:姜女士
- 手機:會員登錄后才可查看
- 郵箱:會員登錄后才可查看
- 郵政編碼:
工作地址
- 地址: