崗位職責(zé):
1、負(fù)責(zé)網(wǎng)頁信息抽取技術(shù)的研究和開發(fā);
2、負(fù)責(zé)爬蟲各個系統(tǒng)核心代碼開發(fā);
3、提高數(shù)據(jù)抓取的效率和質(zhì)量,解決數(shù)據(jù)的重復(fù),垃圾數(shù)據(jù)識別,清洗;
4、提高系統(tǒng)的可運維,可測性,易用性。
任職要求:
1、3年以上python或java開發(fā)經(jīng)驗;
2、熟悉MYSQL,MSSQL,具備sql調(diào)優(yōu)經(jīng)驗;
3、了解爬蟲的設(shè)計及實現(xiàn)流程;
4、了解HTML基礎(chǔ)知識;
5、具備團隊協(xié)作精神;
6、了解文本分類,統(tǒng)計分析,自然語言處理,機器學(xué)習(xí)算法,熟悉前端技術(shù)和分布式計算,有分布式存儲經(jīng)驗者優(yōu)先。
聯(lián)系我時,請說是在廣州校園網(wǎng)上看到的,謝謝!