“顧名思義,Data Science 譯為數(shù)據(jù)科學(xué),是一門利用數(shù)據(jù)學(xué)習(xí)知識的學(xué)科,其目標(biāo)是通過從數(shù)據(jù)中提取出有價值的部分來生產(chǎn)數(shù)據(jù)產(chǎn)品。它結(jié)合了諸多領(lǐng)域中的理論和技術(shù),包括應(yīng)用數(shù)學(xué)、統(tǒng)計、模式識別、機(jī)器學(xué)習(xí)、數(shù)據(jù)可視化、數(shù)據(jù)倉庫以及高性能計算。數(shù)據(jù)科學(xué)通過運(yùn)用各種相關(guān)的數(shù)據(jù)來幫助非專業(yè)人士理解問題。”
數(shù)據(jù)科學(xué)集合了計算機(jī)科學(xué)/信息技術(shù)、數(shù)學(xué)、機(jī)器學(xué)習(xí)、數(shù)學(xué)/統(tǒng)計學(xué)、軟件開發(fā)、商科以及傳統(tǒng)研究方法等等領(lǐng)域。是一門非常綜合且實用的學(xué)科。? ? ????數(shù)據(jù)科學(xué)技術(shù)可以幫助我們正確地處理數(shù)據(jù)并協(xié)助我們在生物學(xué)、社會科學(xué)、人類學(xué)等領(lǐng)域進(jìn)行研究調(diào)研。
此外,數(shù)據(jù)科學(xué)也對商業(yè)競爭有極大的幫助。各個行業(yè)的頭部公司,如今都會組辦自己的行業(yè)研究部門和通過大數(shù)據(jù)分析消費(fèi)者行為與偏好的部門,例如 Netflix,迪士尼,國內(nèi)的 BAT,京東小米等大廠。
數(shù)據(jù)科學(xué)和信息科學(xué)、統(tǒng)計學(xué)、機(jī)器學(xué)習(xí)等學(xué)科有什么不同?
數(shù)據(jù)科學(xué)依賴兩個因素:一是數(shù)據(jù)的廣泛性和多樣性;二是數(shù)據(jù)研究的共性。現(xiàn)代社會的各行各業(yè)都充滿了數(shù)據(jù),這些數(shù)據(jù)的類型多種多樣,不僅包括傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù),也包括網(wǎng)頁、文本、圖像、視頻、語音等非結(jié)構(gòu)化數(shù)據(jù)。數(shù)據(jù)分析通常是隨機(jī)模型的反問題,因此它們的研究有很多共性。例如,自然語言處理和生物大分子模型都用到隱馬爾科夫過程和動態(tài)規(guī)劃方法,其最根本的原因是它們處理的都是一維隨機(jī)信號;再如,圖像處理和統(tǒng)計學(xué)習(xí)中都用到的正則化方法,也是處理反問題的數(shù)學(xué)模型中最常用的一種。
數(shù)據(jù)科學(xué)主要包括兩個方面:用數(shù)據(jù)的方法研究科學(xué)和用科學(xué)的方法研究數(shù)據(jù)。前者包括生物信息學(xué)、天體信息學(xué)、數(shù)字地球等領(lǐng)域;后者包括統(tǒng)計學(xué)、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、數(shù)據(jù)庫等領(lǐng)域。
對于那些希望在高科技相關(guān)領(lǐng)域(Tech)就業(yè)的人而言,數(shù)據(jù)科學(xué)專業(yè)是明智的職業(yè)選擇。典型的數(shù)據(jù)科學(xué)課程課程通常將應(yīng)用統(tǒng)計等數(shù)學(xué)和統(tǒng)計學(xué)課程作為核心,搭配以SQL和Python等編程技能課程。數(shù)據(jù)科學(xué)碩士課程可以幫助畢業(yè)生為各種領(lǐng)域和領(lǐng)域的工作機(jī)會做好準(zhǔn)備—從數(shù)據(jù)架構(gòu),到計算機(jī)工程,再到編程等。
商業(yè)分析碩士Master’s in Business Analytics
商業(yè)分析碩士學(xué)位專注于數(shù)據(jù)應(yīng)用,以研究消費(fèi)者、市場和世界經(jīng)濟(jì)趨勢。商業(yè)分析的學(xué)生研究將大量收集的數(shù)據(jù)轉(zhuǎn)化為可操作的業(yè)務(wù)戰(zhàn)略決策的過程和技術(shù)。例如,企業(yè)或市場分析師可能會觀察到消費(fèi)者行為的趨勢,并進(jìn)行定價或目標(biāo)客戶細(xì)分的決策制定。“數(shù)據(jù)驅(qū)動決策”是這門學(xué)科的核心。本質(zhì)上,商業(yè)分析是商科的細(xì)分方向,對商業(yè)決策過程方法論的學(xué)習(xí)大于數(shù)據(jù)分析方法本身。
信息系統(tǒng)碩士Master’s in Information Systems
什么是信息系統(tǒng)?信息系統(tǒng)是通常由技術(shù)驅(qū)動的系統(tǒng),用于收集、組織、說明和整合各種形式的信息和數(shù)據(jù)。大多數(shù)信息系統(tǒng)屬于“基于計算機(jī)”的類別,用于支持組織的業(yè)務(wù)流程。因此基于現(xiàn)成的計算機(jī)架構(gòu)、語言和系統(tǒng)進(jìn)行的信息收集、組織和整合的工作是重點。信息系統(tǒng)的碩士學(xué)位課程通常面向?qū)ι虡I(yè)環(huán)境中的技術(shù)管理崗位。信息系統(tǒng)專業(yè)學(xué)生接受信息系統(tǒng)設(shè)計和分析、數(shù)據(jù)庫管理和系統(tǒng)架構(gòu)方面的訓(xùn)練。
運(yùn)籌學(xué)和相關(guān)工程學(xué)科Master’s in Operations Research
該專業(yè)涉及應(yīng)用先進(jìn)的分析方法,以幫助做出更好的決策。它通常被認(rèn)為是應(yīng)用數(shù)學(xué)的一個子領(lǐng)域。具體而言,這個專業(yè)學(xué)習(xí)采用其他數(shù)學(xué)科學(xué)的技術(shù),如數(shù)學(xué)建模,統(tǒng)計分析和數(shù)學(xué)優(yōu)化,運(yùn)算研究來為復(fù)雜的決策問題找到最優(yōu)或接近最優(yōu)的解決方案。由于其強(qiáng)調(diào)人力-技術(shù)互動,并且由于其專注于實際應(yīng)用,運(yùn)營研究與其他學(xué)科重疊,特別是工業(yè)工程和運(yùn)營管理,并借鑒了心理學(xué)和組織科學(xué)。因此在工程學(xué)里也和工業(yè)工程專業(yè)重疊。運(yùn)籌學(xué)通常關(guān)注目標(biāo)的最大化(利潤,績效或收益)或最小化問題(損失,風(fēng)險或成本)。
數(shù)據(jù)科學(xué)中的其他相關(guān)碩士學(xué)位
雖然以上三個專業(yè)是和數(shù)據(jù)科學(xué)與分析最相關(guān)的專業(yè),但它們并非僅有的學(xué)位—還有許多其他課程也符合數(shù)據(jù)科學(xué)相關(guān)崗位的需求。例如,對于那些對計算機(jī)編程特別感興趣的人來說,集中在計算機(jī)科學(xué)、計算機(jī)工程或網(wǎng)絡(luò)安全等領(lǐng)域的學(xué)位也是適合的。另外的選擇還有:
健康信息學(xué):學(xué)習(xí)創(chuàng)建、分析和解釋生物數(shù)據(jù),以幫助發(fā)現(xiàn)世界健康和醫(yī)學(xué)的趨勢。
地質(zhì)信息系統(tǒng):對于地質(zhì)領(lǐng)域,GIS是挖掘地理數(shù)據(jù),分析空間信息甚至編輯地圖數(shù)據(jù)的重要工具。
公共政策的數(shù)據(jù)分析:公共政策領(lǐng)域大量使用數(shù)據(jù),以解釋人口,死亡率和教育水平等領(lǐng)域的國內(nèi)和世界趨勢。
統(tǒng)計和數(shù)學(xué)
編程語言,如R或Python
人工智能
信息系統(tǒng)
分析決策過程
工程學(xué)方法

? 2025. All Rights Reserved. 滬ICP備2023009024號-1