對于一家業務遍布全球的企業來說,需要多大規模的IT運維團隊,才能保證日常業務的穩定運行?
作爲一家源自瑞典的腕表品牌,DANIEL WELLINGTON(以下簡稱“DW”)以北歐簡約設計理念,爲消費者提供個性化配飾選擇。自從2011年成立以來,DANIEL WELLINGTON品牌在全球範圍內掀起腕表時尚的新潮流,業務發展非常迅猛。
截至目前爲止,DW已經與100多家市場的分銷商建立了合作,共有8000多個銷售點,並且在全球設置了十四個辦公地點:斯德哥爾摩、烏普薩拉、紐約、洛杉矶、倫敦、科隆、首爾、東京、新加坡、香港、上海、深圳、孟買和迪拜。
然而正如公司産品的簡約設計理念一樣,DW這樣一家業務遍及全球的企業,其IT運維團隊卻精簡到令人驚歎。而在這一切的背後,則是來自AWS的豐富雲服務和強大技術支持。
“通過使用AWS,DW實現了全球統一的IT架構部署和資源協作,我們用14人的運維團隊就支持了DW集團跨越北京、甯夏、新加坡、東京四個城市的IT應用。”DW中國CTO王耀東如是表示。
以全球統一部署爲第一原則
早在2014年,DW就開始使用AWS,全球的業務應用全部運行在AWS上,在海外使用了AWS歐洲(愛爾蘭)區域、美國(俄勒岡)區域、亞洲(日本)區域、亞洲(新加坡)區域。
DW于2015年進入中國市場。爲了貼近中國消費者,決定選擇由北京光環新網科技股份有限公司(“光環新網”)和甯夏西雲數據科技有限公司(“西雲數據”)運營的AWS中國區域,在中國獨立搭建一套IT應用。
DW中國CTO王耀東表示:“之所以在中國選擇AWS,是因爲DW在海外已經使用AWS,體驗很好。我們決定把全球統一部署作爲我們的第一原則,這樣便于管理和協作。”
從2016年開始,DW將官方中文網站由歐洲區域遷移到光環新網運營的AWS中國(北京)區域。當時,AWS在中國還是以有限預覽的方式爲精選客戶提供服務。後來,DW相繼啓用由光環新網運營的AWS中國(北京)區域和由西雲數據運營的AWS中國(甯夏)區域。
DW在AWS上運行的應用主要分三大類:一是業務系統,包括官方網站商城、零售POS系統、微信H5、公衆號程序等;二是後台系統,包括AD域服務、Microsoft Dynamics NAV ERP、 Microsoft Dynamics CRM等;三是系統接口和微服務,主要是各個系統之間、以及系統和外部供應商之間的數據接口。
AWS如何讓企業獲益
在DW亞太信息技術運營經理管宇輝看來,使用AWS讓DW獲益良多,主要體現在以下四個方面:
1、按需使用,快速部署
近五年以來,DW的營收規模高速增長,如果繼續使用傳統租賃IDC或者自有IDC,DW需要花費大量硬件成本以支持公司的快速擴張。使用AWS之後,DW可以隨時啓動新的服務,只需要完成相應的預算審批流程即可,節省了傳統的年度預算、硬件采購、備件采購維護和運維成本。
2、快速彈性擴容,支撐瞬時流量爆發
DW是社交推廣的明星企業,經常能夠獲得和流量大咖的合作推廣的機會。其中最大的一次合作曝光爲DW官網網站帶來了超過日常400倍的訪問流量爆增。這在使用傳統租用IDC的公司是無法想象也非常難以處理的。而依靠AWS強大的彈性擴容能力,DW得以在1個工作日內完成官網的彈性擴容調整,支撐每一次峰值流量到訪。
3、全球化平台,提高運維效率
AWS全球統一的管理架構、統一的API、雙語支持,使得中國和瑞典兩地的運維團隊可以利用7個小時的時差,互相運維對方的雲平台,從而大大降低了人力成本,也讓運維團隊盡量減少夜班和節假日加班。借助AWS雲、通過全球協作實現工作與生活的平衡,讓DW運維團隊頗爲自豪。每逢電商大促季,在中國,我們熟悉的場景都是全員通宵奮戰。而在DW,就可以晚上只安排少量的運維人員值班,而由另一時區的運維團隊代勞。如果有系統異常,直接進入相關區域的賬號進行第一輪檢查和處理以及緊急修複操作。若需要,才會聯系當地人員一起進行第二輪的問題修複。這樣的替補機制,能讓運維人員以正常的作息時間應對24小時不停的在線業務。此外,在DW中國的服務落地過程中,深圳的運維團隊利用AWS東京區域和新加坡區域爲DW中國的業務提供支持,將服務落地時間從1-2個月縮短到了1-2天。
4、責任共擔,精簡團隊
管宇輝帶領的亞太區運維和支持團隊只有14人,卻要管理DW北京、甯夏、新加坡、日本四大區域的IT應用,從架構、部署、安全到運維,以一個精簡但專業的團隊支撐了DW中國和亞太兩個大區的業務發展。
DW使用AWS雲服務非常全面,據統計超過30多種,所使用的AWS雲服務包括Amazon Elastic Compute Cloud (Amazon EC2)、Amazon EC2 Container Registry (Amazon ECR)、Amazon EC2 Container Service (Amazon ECS)、AWS Lambda、Elastic Load Balancing (ELB)、Amazon Simple Storage Service (Amazon S3)、Amazon Elastic Block Store (Amazon EBS)、Amazon Simple Storage Service Glacier (Amazon S3 Glacier)、Amazon Aurora、Amazon Relational Database Service (Amazon RDS)、Amazon DynamoDB、Amazon ElastiCache、Amazon Redshift、Amazon Virtual Private Cloud (Amazon VPC)、AWS Direct Connect、Amazon CloudWatch、Amazon EC2 Systems Manager、AWS CloudFormation、AWS CloudTrail、AWS Config、AWS Identity and Access Management (IAM)、Amazon Athena、Amazon Elasticsearch Service、Amazon Kinesis、Amazon API Gateway、Amazon Cognito等。以下就是DW基于AWS雲的系統架構圖。
DW基于AWS雲的系統架構圖
運維自動化:DW使用AWS的心得
DW使用AWS的一個重要心得,就是運維自動化。管宇輝表示,DW盡量不讓運維人員陷入到重複的運維工作中。
1、自動化部署
DW有超過90%的基礎架構已經實現了使用AWS CloudFormation自動化腳本部署。
使用AWS CloudFormation,DW可以爲服務或應用程序架構創建模板。當需要做新的部署或者擴容時,只需複制現有模板,必要時適當修改參數,就可以使用這些模板,快速、可靠地配置服務或應用程序。從瑞典團隊開始,DW就非常注重IT架構的安全可靠與運維自動化。因此,亞太團隊開始工作時,也從瑞典團隊借鑒了主要的模板和方法。
同時,DW會使用AWS Config服務,評估、審計相關的AWS 資源配置。AWS Config會持續監控和記錄AWS資源配置,判斷相關的配置是否符合內部指南的配置要求。DW也會通過CloudTrail,對AWS 賬戶進行監管、合規性檢查、操作審核和風險審核。
DW還會定期根據AWS架構完善的框架(Well-Architected Framework),對自己的IT架構進行評估,確定下一步優化的方向。例如在一次IT架構評估中,DW意識到日志審計應該建立單獨的賬戶,這樣能夠更好地控制安全風險。
2、容器化
DW提高運維水平的另一個措施,是使用Amazon ECR、Amazon ECS,將傳統的Amazon EC2架構轉變成容器化的架構。實現容器化以後,DW使用Amazon EC2 Auto Scaling組,實時地檢測每一台主機、每一個容器的健康度。如果其健康度有問題,或者某個組件失效,DW會通過自動化的手段重啓相應的業務程序,實現不下線的平穩操作。
通過一系列的措施,DW中國IT團隊在2018年7月5日接管中國官網以後,實現了99.98%的可用性,將官網可用性提高了0.05%,並且在全天高峰銷售時段實現了100%可用性記錄,幾乎最大程度地幫助業務部門實現業務目標。
3、無服務器架構
DW在接口層和定時應用中,大量使用Lambda和Amazon API Gateway無服務器服務技術進行部署。通過無服務器架構,大大提高了DW應用系統之間接口的靈活性。例如,DW擁有官方網站、天貓商城、京東、微信小程序等衆多訂單系統,都需要向ERP系統傳輸數據。按照以往的做法,每一個訂單系統,都要分別寫程序與ERP系統對接。使用Lambda無服務器技術,DW在訂單系統和ERP系統之間僅做一個接口應用,就可以實現ERP系統跟任意訂單系統的對接。
采用無服務器架構實現接口應用主要有兩個好處:一是自動實現彈性擴容。即使訂單量猛增的情況,DW也不用擔心訂單系統過度承壓,Lambda會自動實現彈性擴容。采用傳統的架構,在進行市場促銷活動之前一定要對訂單系統進行壓力測試,如果發現服務器有瓶頸,就要提前擴容,以免在“雙十一”大促這樣的情況下訂單流出現瓶頸。采用無服務器架構,即便每分鍾10萬訂單量,AWS都能輕松處理。
突發流量對DW這樣的時尚品牌來說是比較常見的,曾有一位時尚博主發送了一條關于DW産品的微博,當天DW官網的流量就增長了3倍。采用無服務器架構,讓DW毫無壓力。
二是接口可以複用。同一個接口應用,只要修改一個接口代碼,就可以對接不同的ERP和不同的訂單系統。例如,可以對接DW在韓國、歐洲和澳洲的ERP。同時用這一個接口應用,可以輕松對接官網、天貓、淘寶和京東。
實際上,DW在中國就有8個電商平台,如果按以前的模式,需要做8次開發,分別實現8個電商平台與ERP的對接。現在,只需要修改接口,跟8個平台的標准開發文檔對應上,就可以讀取數據。而且這個接口應用是從瑞典團隊複制過來的。所以,DW中國團隊相當于只用五分之一的精力,就實現了以前8份工作的效力。
多種數據庫服務讓DW如虎添翼
DW使用了由光環新網和西雲數據提供的AWS全系列的數據庫服務。其中,官網主數據庫使用Amazon RDS (MySQL),積分商城主數據庫使用Amazon Aurora,大系統之間的緩存使用ElastiCache,無服務器架構的接口數據庫使用DynamoDB,數據倉庫使用Amazon Redshift。
DW對這些托管式數據庫服務很認可。管宇輝以Amazon RDS舉例說,托管式服務讓DW的運維非常省事。以前,運維人員需要關心數據庫版本是否更新,是否有新的問題以及是否需要修複;在設計數據庫架構的時候,要考慮跨可用區或跨區域的災備需求;數據備份頻率以及用什麽備份存儲等等。不僅要關注設計,還需要手動配置。使用Amazon RDS以後,能夠自動實現版本升級,對安全漏洞打補丁,同時會給客戶發送即時提醒,DW通過這些郵件和信息就掌握全部情況。
Aurora則在Amazon RDS的基礎上更進了一步,自動進行三個可用區的災備,讓DW更加放心。Aurora的高性價比也令管宇輝印象深刻。他做過一個比較,積分商城在西雲數據運營的AWS中國(甯夏)區域使用Aurora,與之前相比,成本進一步降低了50%。
DW使用AWS的經驗和心得非常多,例如DW在安全與權限管理、嘗試IoT新服務推進新零售、團隊能力培養等方面,都有很多可以借鑒之處。
作爲一個勇于創新、勇于嘗試的團隊,DW的IT團隊遇到AWS如此豐富的雲服務功能,可以說是如魚得水,如虎添翼。
“非常高興DW中國選擇了AWS雲。同時,由光環新網和西雲數據運營的AWS(中國)區域近兩三年的高速發展,上線了新的區域和許多新服務。DW已經啓動了新項目的POC,將繼續在AWS雲上做一些有趣的實驗和探索,進一步挖掘IT的潛力,推動業務更上一層樓。”王耀東說道。