在機(jī)器學(xué)習(xí)這一領(lǐng)域研究中,繼谷歌和Facebook之后越來(lái)越多的公司加入了對(duì)于最優(yōu)秀的機(jī)器學(xué)習(xí)專家和數(shù)據(jù)科學(xué)家的競(jìng)爭(zhēng)之中。與此同時(shí),我們也看到了物聯(lián)網(wǎng)和數(shù)據(jù)科學(xué)的結(jié)合。未來(lái)一年,數(shù)據(jù)科學(xué)的的發(fā)展趨勢(shì)是什么方向呢?讓我們往下閱讀。
在數(shù)據(jù)科學(xué)領(lǐng)域,大數(shù)據(jù)和物聯(lián)網(wǎng)正在持續(xù)快速增長(zhǎng)著。目前的商業(yè)中已經(jīng)逐漸可以把不同來(lái)源的數(shù)據(jù)拼湊在一起,并獲得更多的信息,這也就意味著數(shù)據(jù)將變得更有意義。在開(kāi)發(fā)新的商業(yè)模式和獲得增長(zhǎng)的過(guò)程中,使用數(shù)據(jù)已經(jīng)變得越來(lái)越重要。世界各地的企業(yè)都在尋找一些可以利用數(shù)據(jù)進(jìn)行商業(yè)化并從中獲利的方式。接下來(lái)就是我們?cè)?017年的數(shù)據(jù)科學(xué)界可能看到的現(xiàn)象以及數(shù)據(jù)科學(xué)怎樣影響我們。
技術(shù)需求上的改變
機(jī)器學(xué)習(xí)曾被特斯拉的Elon Musk稱之為“被召喚的惡龍”,但到如今,這個(gè)詞還是以高頻率被提起。亞馬遜、Facebook、谷歌都已經(jīng)加入了人工智能的競(jìng)賽中,在2017年,更多的商業(yè)模擬將會(huì)吸引到更多的機(jī)器學(xué)習(xí)數(shù)據(jù)科學(xué)家來(lái)增加他們各自部門實(shí)力。
但是對(duì)于相應(yīng)工作的競(jìng)爭(zhēng)可能也會(huì)更激烈一些。當(dāng)你發(fā)現(xiàn)機(jī)器學(xué)習(xí)已經(jīng)成為數(shù)據(jù)科學(xué)中的一個(gè)職業(yè)時(shí)不要驚訝,從2017年起更多的學(xué)校將會(huì)將人工智能列入他們的課程中。如果你想保持在這一浪潮最前列,那么這里有一些機(jī)器學(xué)習(xí)和人工智能相關(guān)證書(shū)可以供你獲取。然而這里的課程都價(jià)格不菲——通常要10,000美元,相似的這些內(nèi)容在一些訓(xùn)練課程網(wǎng)站如Coursera或者edX都相對(duì)比較便宜或者是免費(fèi)的。
2016年,數(shù)據(jù)科學(xué)家最需要掌握的技能
為了在數(shù)據(jù)科學(xué)領(lǐng)域獲得成就,其他的你還需要擁有的技能包括強(qiáng)大的技術(shù)和編程知識(shí),尤其是使用R語(yǔ)言或者Python,還有SRS和MATLAB的經(jīng)驗(yàn)也是非常有用的。
此外,你還需要習(xí)慣于使用關(guān)系數(shù)據(jù)庫(kù)的工作,因此SQL也是非常重要的。在2015年,從領(lǐng)英上列出的工作列表中,SQL被列為最重要的技能。當(dāng)然,Hadoop、Python和Java也是非常重要。
物聯(lián)網(wǎng)和數(shù)據(jù)科學(xué)的結(jié)合
數(shù)據(jù)科學(xué)和物聯(lián)網(wǎng)經(jīng)常被看成是一個(gè)硬幣的兩面。
由于數(shù)據(jù)科學(xué)總是尋找數(shù)據(jù)和實(shí)時(shí)設(shè)備的接口從而實(shí)現(xiàn)先進(jìn)的數(shù)據(jù)據(jù)分析,甚至用于決策,因此,在2017年,這兩個(gè)行業(yè)將會(huì)走的越來(lái)越近,甚至合并在一起。
那么這一點(diǎn)如何實(shí)現(xiàn)呢?考慮一下一下場(chǎng)景。在不遠(yuǎn)的將來(lái),你可能不需要鑰匙來(lái)進(jìn)入你的家門,當(dāng)你走到門口的時(shí)候,它會(huì)感覺(jué)到你的存在,并自動(dòng)為你開(kāi)門。同時(shí),當(dāng)你離開(kāi)的時(shí)候,它將會(huì)讓家里的所有能量單元關(guān)掉——反而節(jié)省主人的錢。
這可能聽(tīng)起來(lái)像是進(jìn)取號(hào)戰(zhàn)艦(電影《星際迷航》中戰(zhàn)艦)中的場(chǎng)景,但是我們也許在2017年看到這些場(chǎng)景都將開(kāi)始發(fā)生——而且你要確定你有能力來(lái)投入在這些項(xiàng)目中。
人工智能、數(shù)據(jù)科學(xué)等對(duì)于物聯(lián)網(wǎng)的影響,意味著你要能夠處理無(wú)線接口層、不同設(shè)備、邊緣處理、實(shí)時(shí)系統(tǒng)和深度學(xué)習(xí)等領(lǐng)域的工作。
不斷發(fā)展的大數(shù)據(jù)技術(shù)
我們已經(jīng)看到了在2016年天文數(shù)字般的增長(zhǎng),但是在下一年,隨著大數(shù)據(jù)越來(lái)越普及并不斷被企業(yè)所接受使用,大數(shù)據(jù)的預(yù)算還會(huì)繼續(xù)增長(zhǎng)。大多數(shù)企業(yè)也意識(shí)到了他們需要改進(jìn)該領(lǐng)域的商業(yè)模式,這也就意味著需要更多的數(shù)據(jù)科學(xué)家來(lái)獲取并處理大量的額外數(shù)據(jù)。
如果你想要尋找一個(gè)數(shù)據(jù)科學(xué)的職位,大數(shù)據(jù)的知識(shí)和數(shù)據(jù)框架是非常重要的。你尤其需要看看 ApacheHadoop,HDFS,Hbase,Spark,Stom,Solr和Kafka.
由大數(shù)據(jù)引領(lǐng)的醫(yī)療行業(yè)
數(shù)據(jù)科學(xué)已經(jīng)在控制流行病和預(yù)測(cè)病人行為等方面發(fā)揮了重要作用。2015年,數(shù)據(jù)科學(xué)幫助預(yù)測(cè)了西尼羅病毒在美國(guó)的爆發(fā),并達(dá)到了85%的精度。而且在今年早些時(shí)候,一個(gè)科學(xué)家團(tuán)隊(duì)開(kāi)發(fā)了一個(gè)可以預(yù)測(cè)蝙蝠攜帶埃博拉病毒的模型。期待著2017年數(shù)據(jù)科學(xué)在醫(yī)療行業(yè)的進(jìn)一步應(yīng)用,并希望醫(yī)療行業(yè)能夠不斷找到更好的方式來(lái)滿足日常需求和拯救生命。
隨著電子醫(yī)療記錄儀記錄數(shù)據(jù)量的增加,我們所處理的數(shù)據(jù)已經(jīng)達(dá)到歷史最高水平。盡管大量的數(shù)據(jù)有他自身的有點(diǎn)和缺點(diǎn),但是對(duì)于數(shù)據(jù)科學(xué)家而言這里存在著巨大的商機(jī),期待他們?cè)?017來(lái)破解這些數(shù)據(jù)的秘密,如果你正在尋找一個(gè)新興市場(chǎng),那么醫(yī)療行業(yè)就是了。