隨著大數(shù)據(jù)的應(yīng)用與發(fā)展,各行業(yè)對具有數(shù)據(jù)科學(xué)技能的開發(fā)人員的需求持續(xù)增長。而希望成為數(shù)據(jù)科學(xué)家的技術(shù)人員需要學(xué)習(xí)如何融入這個(gè)領(lǐng)域的職業(yè)生涯。
尋求擴(kuò)大在技術(shù)領(lǐng)域的技能?據(jù)技術(shù)招聘網(wǎng)站Indeed Prime主管Shu Wu介紹,目前對擁有數(shù)據(jù)科學(xué)技能的開發(fā)人員的需求目前“非常強(qiáng)勁”,過去四年來,數(shù)據(jù)科學(xué)家的職位需求“大幅增長”。
Shu Wu說:“數(shù)據(jù)科學(xué)家就業(yè)前景看好,平均薪酬很高,但成為數(shù)據(jù)科學(xué)家是很艱難的。數(shù)據(jù)科學(xué)家是一個(gè)研究數(shù)據(jù)的偉大的專家,能夠使整個(gè)組織的數(shù)據(jù)得到消化和解析。”
美國塔夫斯大學(xué)IEEE研究員兼研究生院院長Karen Panetta說,技術(shù)進(jìn)步和大量的在線數(shù)據(jù)正在影響著每一個(gè)部門,對經(jīng)濟(jì)產(chǎn)生了巨大的影響。這種所謂的“數(shù)據(jù)雪崩”不僅僅是數(shù)據(jù)量的龐大,而且還包括其變化和發(fā)展的速度,以及可用的各種數(shù)據(jù)類型。
Panetta表示:“知道如何使用電子表格和傳統(tǒng)數(shù)據(jù)庫不足以應(yīng)對新興大數(shù)據(jù)革命。數(shù)據(jù)分析需要實(shí)時(shí)完成,這對決策可能至關(guān)重要,能夠簡單地知道如何使用軟件工具只是這個(gè)挑戰(zhàn)的一部分,了解跨學(xué)科的數(shù)據(jù),能夠傳達(dá)其意義,并使用統(tǒng)計(jì)數(shù)字將是與傳統(tǒng)‘數(shù)字糾正器’不同的因素。”
Forrester公司的分析師Mike Facemire表示:“在學(xué)習(xí)使用數(shù)據(jù)的編程語言方面,所有語言的標(biāo)準(zhǔn)是找到一些東西,并做到這一點(diǎn)。”“編寫代碼是一個(gè)偉大的事情,而做錯(cuò)是一個(gè)很好的學(xué)習(xí)經(jīng)歷。”Facemire建議開發(fā)人員去開源社區(qū)Github查看示例,并找到一個(gè)感興趣的數(shù)據(jù)集并學(xué)習(xí)分析它。
最終,了解如何通過將其分解成較小的部分來了解如何解決問題,而不是了解該語言本身,F(xiàn)acemire說。他說:“最后,這只是一種與電腦接口的方法。計(jì)算機(jī)不在乎你使用哪種語言,它更關(guān)心是否正確地解決了問題,以獲得正確的結(jié)果。”
Panetta表示,一些教育機(jī)構(gòu)已經(jīng)創(chuàng)建了數(shù)據(jù)科學(xué)學(xué)位課程,包括美國的東北大學(xué),波士頓大學(xué),紐約市立大學(xué)和莫瑞麥克學(xué)院。其中一些學(xué)校提供在線課程,通過IEEE計(jì)算機(jī)學(xué)會提供低成本課程和研討會。
如果技術(shù)人員想從事數(shù)據(jù)科學(xué)方面的事職業(yè),那么應(yīng)該考慮學(xué)習(xí)這三種語言的一種。
(1)R語言
Panetta表示,R是一種用于數(shù)據(jù)挖掘人員開發(fā)統(tǒng)計(jì)軟件和數(shù)據(jù)分析的語言和框架。
Facemire說,過去幾年數(shù)據(jù)分析和數(shù)據(jù)科學(xué)變得越來越流行,這對編程語言發(fā)生了巨大的沖擊。然而,其受歡迎程度已趨于平穩(wěn)。R語言具有為數(shù)據(jù)科學(xué)家構(gòu)建的工具,可以專門用于擴(kuò)展和插件。
Panetta說:“學(xué)習(xí)像R語言的人們必須了解基本的數(shù)學(xué)技能。如果我們只是信任軟件的輸出,不知道我們真正測量的是什么,而不理解我們提供的數(shù)據(jù)作為輸入,其結(jié)果將是災(zāi)難性的。”
(2)Python
Python是一種通用的語言,它已經(jīng)很強(qiáng)大,并且包括可以適應(yīng)需要在網(wǎng)站或移動設(shè)備上顯示的可視化環(huán)境的工具,F(xiàn)acemire說。Python也比R更加易讀。
技術(shù)人員如果問道,“如果在考慮我的職業(yè)生涯時(shí),我想成為一名數(shù)據(jù)科學(xué)家,那么我應(yīng)該學(xué)習(xí)哪種語言?”Facemire說,“那么我會推薦R和Python,看看哪個(gè)語言對你有意義,這二者都是絕對可行的”。他補(bǔ)充說,企業(yè)通常根據(jù)數(shù)據(jù)科學(xué)家的技能要求優(yōu)先考慮編程語言。
(3)Java
根據(jù)WPEngine的一項(xiàng)調(diào)查,Java最近被列為最受歡迎和最通用的語言之一。它是另一種通用編程語言,它被專門設(shè)計(jì)為盡可能少地實(shí)現(xiàn)依賴關(guān)系。它可以用來構(gòu)建任何東西,特別是可伸縮的多線程平臺,并且具有強(qiáng)大的用戶基礎(chǔ)。
Panama說,Java也是一種解釋語言。與C和C++不同,Java語言不需要對硬件有著更多的了解。這使得計(jì)算機(jī)科學(xué)與工程以外的學(xué)習(xí)人員更容易學(xué)習(xí)。事實(shí)上,Java在技術(shù)職位方面也是需求最多的編碼語言。