編輯
請點擊輸入圖片描述
身在坡縣的你,知道身邊正在發生著什麽嗎?知道這個地圖上的小紅點正在往哪個方向努力嗎?
編輯
新加坡之小,Source: Maphill
衆所周知,新加坡的建國史就是一部逆襲史。1965年8月,以巫統爲首的馬來西亞執政聯盟在國會緊急通過修改憲法,以126票贊成、0票反對,將新加坡驅逐出馬來西亞。時任新加坡州長的李光耀在電視台的鏡頭前放聲大哭,宣布獨立建國。
編輯
新加坡被馬來西亞開除,Source: 網絡
作爲20世紀世界政壇上的耀眼明星,李光耀是何等堅毅人物,怎會因爲新加坡的獨立而悲痛哭泣?根據李的自傳《風雨獨立路》,原來,他是在爲新加坡的未來擔憂:“我們眼前困難重重,生存機會非常渺茫”。
編輯
新加坡國父李光耀,Source: 網絡
獨立後的新加坡只有七百多平方公裏,自然資源極度匮乏,連淡水都沒有。從地緣上看,新加坡的北面是翻臉不認人的馬來西亞;南面是虎視眈眈想要吞並自己的印尼;臨近的馬六甲海峽又是兵家必爭之地。彼時的新加坡,可謂危如累卵,當時的國際評論都認爲新加坡將走投無路。
生存的危機感,也是創造經濟奇迹的原動力。爲了求存求活,新加坡政府毅然選擇了走工業化的道路,利用港口貿易的優勢吸引外資,順應全球化發展的大趨勢,大力發展經濟。
新加坡用了四十多年,從當年風雨飄搖的小漁村,變成了今天的世界金融中心。根據最新數據,新加坡人均GDP爲57714美元,是全球最富裕的國家之一。
編輯
今日新加坡,Source: 網絡
然而,就算已經完成逆襲,新加坡人還是有著居安思危的憂患意識。隨著計算機、互聯網、大數據、人工智能等科技的發展,新加坡政府開始戰略轉型,開啓信息化時代,不斷推出相關政策,力圖在全球競爭中繼續立于不敗之地。
編輯
Source: 新加坡政府網站
目前,新加坡政府正傾全力進行智慧國家建設。根據新加坡資訊通信發展管理局,智慧國的理念核心可以用三個C來概括:連接(Connect)、收集(Collect)和理解(Comprehend)。其中,需要收集和理解的,正是數據。
1.從數據到數據科學
數據是智慧國家建設的核心。因此,數據科學在新加坡政府眼裏的地位,已經不言而喻了。而這裏的潛台詞,你懂得——從事數據科學相關職業的人才將在新加坡非常吃香!
市場是最靈敏的溫度計。根據聯合早報報道,新加坡目前數據相關的人才處于供不應求的狀態。而根據Payscale的數據,目前新加坡數據科學家的年薪中位數已經達到72K,加上Bonus,最高可以達到112K!
編輯
Source: Payscale.com
BestTop整理了Glassdoor.com上一些企業的數據科學家的薪資水平供大家做進一步參考(單位:新幣/月),可以看到,新加坡數據科學家的月薪基本都在5000新幣以上,最高甚至能達到10000:
編輯
Source: Glassdoor.com
那麽,數據科學到底是做什麽的呢?
簡單來說,數據科學家是一項綜合了數學、統計、建模、編程,以及垂直行業知識的工作,可以從海量數據中找出最有價值的信息、洞見甚至知識,並應用于商業和研究領域。
編輯
Source: 網絡
數據科學家像是探險家與偵探的結合體,有些人甚至戲稱數據科學家是“手裏拿著水晶球(其實是MacBook Pro),嘴裏嚷嚷著令人難以理解的晦澀詞彙(機器學習,隨機森林,深度神經網絡,貝葉斯後驗等),並對未來做出精准的預測的那麽一群巫師”。
關于數據科學的“辦案流程”,BestTop的數據科學領域導師Allen(投行出身,2年Deutsche Bank流程優化分析師經驗;前KPMG兼並收購分析師;前Uber數據分析師)是這樣總結的:
問題定義:誰是你的客戶?你的客戶到底想要你解決什麽問題?你應該如何把一個模糊的需求轉化爲一個具體的,界定清晰的數據問題?
數據收集:是否有現成的數據?如果是的話,哪一部分的數據對解決問題有幫助?如果不是的話,需要哪些額外的數據?收集這些額外的數據需要動用哪些資源(時間,金錢,技術)?
數據處理:在現實場景中的原始數據一般很少能夠被直接使用,數據科學家在面對原始數據時通常要面臨數據錯誤,數據損壞,數據丟失等一系列問題。數據科學家首先要做的便是將原始數據進行清洗,並將其轉化成適合進一步分析的數據格式。
數據挖掘:一旦完成了數據清洗,下一步需要做的就是數據挖掘。數據挖掘指的是對數據內部隱含的規律,模式以及相關性進行探索,從中提取有價值的信息。
數據建模:數據建模通常是整個數據科學流程中最引人矚目的一個環節,在這個步驟裏,數據科學家會根據要解決的問題和現有的數據選擇適用的機器學習,深度學習或是統計的相關模型,然後從模型輸出的結果裏提煉出能夠爲決策服務的內容。
成果溝通:這是最後一個也是最重要的環節,所有你之前完成的分析和建模工作將會變得一文不值,如果你不能夠把你的成果有效地與你的領導進行溝通。這個環節通常是最容易被數據科學家忽略或輕視的,但事實上,溝通能力以及如何讓非技術背景的受衆能夠非常直白地理解一個技術話題是至關重要的。
2.數據科學相關職位
由于數據科學屬于計算機、數學統計和商科的交叉領域,數據科學相關的職位也有著不同的偏向和側重。一般來說,數據科學有兩個分支, 一個偏向technical,對技術的要求比較高,如數據挖掘師,數據架構師;一個偏向Business,即看重商業敏銳度,如數據分析師、商業分析師。
大數據工程師
主要工作內容:收集和存儲大量數據;構建,測試和維護大規模的大數據架構,如數據庫和數據處理系統;通過接觸基于Hadoop的多種技術 – MapReduce,Hive MongoDB或Cassandra,參與設計大數據解決方案;負責數據庫集成;使用非結構化數據集並將其轉換爲適合分析的格式的數據集。
數據架構師
主要工作內容:負責組織數據架構的各個方面,包括:造型、建造、實施、維護;研究企業的數據需求,並爲每個部門/服務區域實施戰略模型;定期更新有關計劃,發展和關注領域的管理。
數據倉庫經理
主要工作內容:設計,開發和維護數據倉庫和數據集市;與參與數據庫操作的所有專家(開發人員、管理員和經理)協作,以確保整個數據系統符合:該組織的戰略目標和組織數據架構的目標。(市場上的一些倉庫産品包括Microsoft SQL Server和Oracle。使用它們的企業需要雇用數據倉庫管理員。)
數據建模師
主要工作內容:基于複雜的業務數據開發用戶友好的計算機系統數據庫;與數據架構師協作,並使用理論、邏輯和物理數據模型來創建滿足組織要求的數據庫解決方案;設計模型,通過以下方式提高運營效率;減少數據冗余 增加數據 – 系統兼容性,以確保在整個組織內有效地傳輸數據。
商業智能分析師
主要工作內容:根據要求爲管理層提供基于數據的見解、研究數據趨勢,檢索對業務運營至關重要的信息。
3.拿下數據科學offer
想要成爲一名數據科學家,就要做好學習多領域知識的准備。總的來說,數據科學相關的技能可以分爲兩大類:
第一大類是Hard Skills,也就是非常偏向編程、建模技術的能力,包括SQL、R和Python等數據處理分析相關程序的掌握。(文末可領取Hard Skills學習資料包)
其中,如果你想成爲一名數據工程師,SQL這款數據庫語言絕對是必備的。
編輯
請點擊輸入圖片描述
而關于R和Python之爭,近年來,Python已經成功上位,成爲市場上的主導者(可以看這裏回顧舊文:Python這次徹底上位!到底憑什麽碾壓C++/Java/R/PHP…?),建議把學習重點放在Python上。
而關于大數據處理,你可以選擇的技術有Spark,Hadoop,Kafka,Hive。但總的來說,Spark是業內公認的應該首先學習的大數據框架。
在可視化工具方面,Tableau是所有角色的首選。
編輯
請點擊輸入圖片描述
第二大類就是Soft Skills,包括溝通和呈現的技巧:你如何去說服別人,如何去呈現你的分析結果;以及特定的垂直領域的商業知識,比如商業模型和驅動因素。
然而,作爲一名求職者,該如何准備才能順利拿下數據科學的offer呢?BestTop數據科學領域的導師們認爲,大家可以從以下幾方面努力:
教育背景。如果你的教育背景是偏數理的背景,比如數學、統計、計算機,或電子工程類的,你就因該強調你的教育背景。
實習經曆。如果你有數據分析相關的實習,你應該把它強調出來,特別是你如何完成一個數據分析項目的過程。
自學課程。如果也沒有實習經驗,你就應該在簡曆裏強調你的相關經曆是通過完成一些自學課程獲得的。
數據分析比賽。如果你參加了一些數據分析的比賽,即便沒有獲得名次,也可以把它列在簡曆裏,然後面試的時候和面試官分享你參加比賽的經驗,以及你從中的收獲。
2019春招進行時,目前是做求職准備的黃金時間。











