職位描述
該職位還未進行加V認證,請仔細了解后再進行投遞!
職位描述:
工作內容
1. 負責當前采集系統,采集器的維護,并跟據需求進行功能擴展升級
2. 負責新的數據源采集器的設計,編碼,實現工作
3. 負責數據的采集,清洗,結構化,標簽化,數據預處理,入庫以及部分后臺數據服務器的開發工作
4. 優化采集策略和防屏蔽規則,提升各類網頁采集效率和質量
5. 采集端數據源采集規則管理,跟蹤,監控,報警
6. 與數據分析師,數據管理員協作,完成日常對數據的統計,查詢,分析工作
任職要求
1. 全日制統招本科以上學歷,計算機軟件相關專業,2年以上產品級采集相關工作經驗
2. 熟悉http協議,網頁采集基本原理,熟悉正則表達式,xpath/css selector/ajax等基本技術
3. 熟練使用常用的數據結構與算法
4. 熟悉python/js語言; 熟練使用scrapy,有nodejs/express/casperjs相關開發經驗者優先
5. 熟悉mysql/redis,有elasticsearch經驗者優先
6. 熟練使用linux操作系統,有linux,數據庫系統管理經驗者優先
工作內容
1. 負責當前采集系統,采集器的維護,并跟據需求進行功能擴展升級
2. 負責新的數據源采集器的設計,編碼,實現工作
3. 負責數據的采集,清洗,結構化,標簽化,數據預處理,入庫以及部分后臺數據服務器的開發工作
4. 優化采集策略和防屏蔽規則,提升各類網頁采集效率和質量
5. 采集端數據源采集規則管理,跟蹤,監控,報警
6. 與數據分析師,數據管理員協作,完成日常對數據的統計,查詢,分析工作
任職要求
1. 全日制統招本科以上學歷,計算機軟件相關專業,2年以上產品級采集相關工作經驗
2. 熟悉http協議,網頁采集基本原理,熟悉正則表達式,xpath/css selector/ajax等基本技術
3. 熟練使用常用的數據結構與算法
4. 熟悉python/js語言; 熟練使用scrapy,有nodejs/express/casperjs相關開發經驗者優先
5. 熟悉mysql/redis,有elasticsearch經驗者優先
6. 熟練使用linux操作系統,有linux,數據庫系統管理經驗者優先
工作地點
地址:重慶江北區重慶
??
點擊查看地圖
詳細位置,可以參考上方地址信息
求職提示:用人單位發布虛假招聘信息,或以任何名義向求職者收取財物(如體檢費、置裝費、押金、服裝費、培訓費、身份證、畢業證等),均涉嫌違法,請求職者務必提高警惕。
職位發布者
HR
北京蛋黃科技有限公司
-
媒體·出版·文化傳播
-
21-50人
-
公司性質未知
-
新南路華融現代廣場3棟20-6

1年以上
本科
最近更新
5534人關注
注:聯系我時,請說是在江蘇人才網上看到的。
