• <nav id="0c0qu"></nav>
  • 綁定機構
    ENG
    資訊詳情頁
    首頁   科技前沿
    混沌工程學拯救了網飛
    日期:2021-08-02 14:07:43 稿件來源:科技縱覽

    在線平臺的極端壓力測試已成為了一門科學。

    聽格雷格?奧澤爾(Greg Orzell)講,最初的混沌猴子(Chaos Monkey)工具很簡單:它隨機在網飛云端某處選取一臺托管的虛擬機,向其發送一個“終止”命令,讓它下線。然后,網飛團隊必須搞清楚接下來怎么做。
    那是十多年前的事了,網飛將自己的系統轉移到了云端,躲過了新的合作伙伴亞馬遜網絡服務(AWS)在美國東海岸引發的一次大規模服務中斷。奧澤爾目前住在德國的美因茨,是GitHub的一名首席軟件工程師。最近,他回憶起了早期混沌猴子的情景,而德國正準備應對又一輪與新冠疫情有關的封鎖和死亡恐懼。外界一片混亂。新冠病毒給人們的日常生活帶來了天翻地覆的變化,而一種應用在計算機網絡中的實踐——“混沌工程”則可以幫助大部分網絡蹣跚渡過這段受新冠疫情影響的時期?;煦绻こ淌且环N利用極端條件進行壓力測試分析的主動方法。這是一種新興的評估分布式網絡方法,主動對正在運行的系統進行使用。通過這種方法,可以建立起在動蕩環境下運營的信心。奧澤爾和他的網飛同事一起用亞馬遜網絡服務軟件開發套件制作了基于Java的工具——混沌猴子。這款工具有點像數字發生器。但當混沌猴子通知一臺虛擬機停止運行時,這不是在模擬。該團隊要求系統能夠承受部分主機服務器和應用服務出現故障?!爸皇亲焐险f‘不好,要發生故障了’,那很簡單?!眾W澤爾說,“我們向你保證下月還會發生兩次故障,因為我們正在制造故障?!被煦绻こ虝捎眯∫幠?、可控制且意義重要的方式,故意定期破壞系統,從而檢查系統能否正常運行,并嘗試從中學習經驗教訓。即使結果顯示系統可按預期運行,也會讓人認識到,工程組織中總會有故障發生。如今的實踐表明,混沌工程非常精妙且積極進取。后續的工具可以有意地讓系統緩慢運行、將網絡流量送入黑洞,還會關閉網絡端口。(最近有一款名為Chaos Kong的應用程序,它能夠在整個地理區域內按比例縮減公司的服務器。系統要有足夠的補償恢復能力才能過關。)此外,工程師還開發了防護和安全措施來控制故障范圍,并制定相應的規制。在網飛,混沌工程已經發展成一個平臺,名為混沌自動化平臺(ChAP),該平臺用于運行專門的試驗(詳見插圖“制造混亂”)。諾拉?瓊斯(Nora Jones)是初創公司Jeli的創始人兼董事長,她說,團隊需要理解何時何地進行試驗。在網飛期間,她幫助完成了ChAP?!半S機在系統的某個部位制造故障是不起作用的?!彼f,“這背后需要有推理和論證?!?/span>

    image.png

    當然,新冠病毒也給網絡流量帶來了全新的混亂。亞馬遜網絡服務的首席解決方案架構師康斯坦丁?岡薩雷斯(Constantin Gonzalez)說,疫情期間的網絡流量也不是都朝一個方向波動。例如,地面交通被暫停時,德國包機巨頭國際旅游聯盟(TUI)的業務急劇提升。他說,不過,打造可恢復網絡的目的在于使網絡有彈性。

    混沌工程很適合這種情況。作為一種工程思維模式,它涉及在登月航天科學發展期間出現的墨菲定律:如果可能會出現問題,那么問題就一定會出現。很難說是這些實踐在疫情期間維持著不堪重負的網絡繼續運行。其中的變數非常多。不過,它對那些使用混沌工程的技術人員是有幫助的,甚至對于資產達4370億美元的新加坡投資機構——星展銀行這樣一家傳統企業也是有幫助的?,F場可靠性工程師哈普利特?辛格(Harpreet Singh)說,星展銀行的網絡彈性項目已經進行了3年,早在2018年項目開始時,相關團隊就在使用混沌工具進行試驗?;靵y似乎是可傳遞的。瓊斯的創業公司Jeli提出了一份她稱之為“催化事件”(可被混沌工程模擬或發動的事件)的策略視圖,其中顯示了組織認為的運行情況與實際運行情況的區別。Gremlin是位于圣何塞的一家有4年歷史的公司,該公司提供的服務產品是混沌工程工具。2021年1月,該公司發布了2021年首份“混沌工程狀態”報告。在發布報告的博文中,該公司市場營銷副總裁艾琳?霍根(Aileen Horgan)講述了這些天有3500多人參加的混沌工程大會。她指出,到目前為止,僅Gremlin的用戶群就進行了近50萬次混沌工程系統攻擊。岡薩雷斯說,亞馬遜網絡服務已經進行混沌工程實踐很久了。今年,隨著網絡化世界有望從前所未有的壓力測試中恢復過來,亞馬遜網絡服務正在啟動一項故障植入服務,云端客戶可用它進行自己的試驗。誰知道未來的需求是什么樣的呢!

     

    作者:Michael Dumiak


    欧美另类粗暴analvideos
  • <nav id="0c0qu"></nav>
  • 檢測查重 官方店鋪

    手機版

    萬方數據知識服務平臺 掃碼關注微信公眾號

    客服
    服務
    回到
    頂部