數(shù)據(jù)挖掘領(lǐng)域是一個(gè)獨(dú)特的行業(yè),通常的招聘方法可能不大適用于本行業(yè)的特點(diǎn)。在招聘一個(gè)合格的數(shù)據(jù)挖掘工程師時(shí),公司一般關(guān)注以下三個(gè)方面:
1、他聰明嗎?
聰明意味著能夠透過復(fù)雜的信息建構(gòu)問題并以正確的方式加以解決。聰明人還能從失敗中獲取經(jīng)驗(yàn)。
2、他是否專注于項(xiàng)目?
專注意味著在各種困難的環(huán)境中,仍能獨(dú)立或合作完成項(xiàng)目。
3、他能否與團(tuán)隊(duì)一起工作?
團(tuán)隊(duì)合作需要很好的溝通能力。工作中涉及到的概念、問題、模型和結(jié)論等都需要成員之間正確的溝通方能加以明確。
為了解候選人是否具有數(shù)據(jù)挖掘工程師的潛質(zhì),需要一個(gè)小時(shí)以上的面試,類似于以下五個(gè)環(huán)節(jié):
1、簡(jiǎn)介
交談寒暄,使候選人放松下來,互相介紹和問答。
2、關(guān)于數(shù)據(jù)挖掘項(xiàng)目
這是一個(gè)重要和耗時(shí)的環(huán)節(jié),主要是詢問候選人最近進(jìn)行的數(shù)據(jù)挖掘項(xiàng)目的情況和處理方式。一般包括以下方面:候選人如何描述這個(gè)項(xiàng)目?候選人在項(xiàng)目中處于什么角色和有什么貢獻(xiàn)?項(xiàng)目持續(xù)了多長(zhǎng)時(shí)間?這個(gè)項(xiàng)目的關(guān)鍵問題是什么?問題如何解決?數(shù)據(jù)挖掘中最困難的階段是什么?最有趣的經(jīng)歷或階段是什么?在候選人眼里,客戶是什么樣的?在他眼里,團(tuán)隊(duì)其他成員是如何表現(xiàn)的?候選人從中獲得了什么樣的經(jīng)驗(yàn)?……
在這個(gè)環(huán)節(jié),不僅要向候選人提問”What“的問題,還要多溝通關(guān)于”Why“的問題。因?yàn)閮?yōu)秀的數(shù)據(jù)挖掘工程師要能夠面對(duì)客戶壓力和要求,清晰地支持回應(yīng)他們的要求,并有理有據(jù)地論證他們提出的觀點(diǎn)。
3、關(guān)于數(shù)據(jù)挖掘的流程
考察候選人對(duì)于工作流程的認(rèn)識(shí)是必要的,如果他談到了跨行業(yè)數(shù)據(jù)挖掘流程規(guī)范(CRISP-DM)意味著好兆頭。有很多時(shí)候,候選人對(duì)這些規(guī)范不以為然。雖然說從不同的角度來看待問題是一種創(chuàng)新,但是創(chuàng)新也需要建立在堅(jiān)實(shí)的流程標(biāo)準(zhǔn)之上,以保證人為決策不會(huì)出現(xiàn)大紕漏。必要時(shí),可以讓候選人在白板上畫出工作流程圖,并讓他評(píng)價(jià)這些工作中最為重要或者最需要反思的地方。因?yàn)榻9ぷ鞑豢赡芤淮瓮瓿?,需要反?fù)地提煉問題和重建模型的情況是經(jīng)常遇到的。
另外,面試中也可能會(huì)集中在某個(gè)挖掘流程進(jìn)行深入考察,例如詢問如何避免過度擬合、如何從大量的候選變量中進(jìn)行篩選、如何評(píng)價(jià)比較模型的效果等。
4、解決問題
軟件公司的面試一般會(huì)包括”編碼測(cè)試“,考察數(shù)據(jù)挖掘工程師也應(yīng)該如此。一種通用的做法是提供一份存在缺陷的分析報(bào)告,讓候選人對(duì)報(bào)告進(jìn)行研究,闡述報(bào)告中結(jié)論的意義,提出其中所存在的問題或不足,以及改進(jìn)或補(bǔ)救的方法。
5、收尾
在面試的最后階段,面試方需要回答候選人提出的問題,并使之相信公司在本行業(yè)的優(yōu)勢(shì)地位或者光明前景,以及從事這個(gè)崗位在職業(yè)生涯中的作用。在完成面試后,面試人通常會(huì)立即將面試記錄整理存檔。
對(duì)于面試人和候選人來說,面試都是繁重的,但也是一個(gè)交流學(xué)習(xí)的好機(jī)會(huì)。通過面試,雙方可以了解到其他人遇到的問題,以及他們是如何解決問題的。