科技改變生活 · 科技引領(lǐng)未來
降低云成本已連續(xù)五年成為企業(yè)最關(guān)注的項(xiàng)目。根據(jù)2021年云計(jì)算狀況報(bào)告,超過60%的組織計(jì)劃優(yōu)化其云成本。本文介紹了導(dǎo)致云資源、時(shí)間和金錢浪費(fèi)的最常見問題,以及相應(yīng)的有效解決方案。降低云成本已連續(xù)五年成為企業(yè)最關(guān)注的項(xiàng)目。根據(jù)2021年云計(jì)
降低云成本已連續(xù)五年成為企業(yè)最關(guān)注的項(xiàng)目。根據(jù) 2021 年云計(jì)算狀況報(bào)告,超過 60% 的組織計(jì)劃優(yōu)化其云成本。本文介紹了導(dǎo)致云資源、時(shí)間和金錢浪費(fèi)的最常見問題,以及相應(yīng)的有效解決方案。
降低云成本已連續(xù)五年成為企業(yè)最關(guān)注的項(xiàng)目。根據(jù) 2021 年云計(jì)算狀況報(bào)告,超過 60% 的組織計(jì)劃優(yōu)化其云成本。那么到底出了什么問題,為什么那么多的工程團(tuán)隊(duì)都在努力進(jìn)行云優(yōu)化呢?
為什么云成本優(yōu)化如此具有挑戰(zhàn)性?
公有云按使用付費(fèi)模式給工程團(tuán)隊(duì)帶來了更多的自由,但這種自由是有代價(jià)的。正如 Pinterest 等公司的云賬單故事所表明的那樣,有時(shí)賬單數(shù)額驚人。
研究證明,大多數(shù)組織都難以應(yīng)對(duì)不斷增長的云計(jì)算賬單。典型的公有云支出平均超出預(yù)算 24%。
有很多原因可以解釋為什么這還在不斷發(fā)生。這些問題通常歸結(jié)為低成本可視化、復(fù)雜的云定價(jià)以及預(yù)估未來需求的問題。所有這些問題都可能會(huì)影響到你企業(yè)的花費(fèi)以及需要花費(fèi)的金額。
云服務(wù)供應(yīng)商也不能完全幫助降低成本。僅僅解讀一張?jiān)瀑~單就可能讓人望而生畏,以至于一些團(tuán)隊(duì)選擇平日視而不見,待到月底收獲“驚喜”。
2022 年需要解決的 6 大云成本優(yōu)化問題
第 1 條:仍然受預(yù)留和儲(chǔ)蓄計(jì)劃的誘惑
當(dāng)考慮在云上節(jié)省開支時(shí),首先想到的是為團(tuán)隊(duì)使用的服務(wù)支付更少的費(fèi)用。公司之所以選擇儲(chǔ)蓄(Savings Plans)或預(yù)留計(jì)劃,是因?yàn)榕c按需定價(jià)模式相比,它們可以享受到相當(dāng)大的折扣。
為一個(gè)看起來可以預(yù)測(cè)的云計(jì)算開支提前做支付計(jì)劃,聽起來很棒。但如果仔細(xì)觀察就會(huì)發(fā)現(xiàn),你不是在解決問題,而是在這個(gè)問題上得到了折扣,并承諾在接下來的幾年里繼續(xù)這樣做。
那么,陷阱在什么地方呢?
Pinterest 預(yù)定了亞馬遜云科技(AWS)價(jià)值 1.7 億美元的服務(wù),但隨后又不得不花費(fèi) 2000 萬美元購買額外的資源。他們的故事說明了這樣一個(gè)事實(shí),即了解企業(yè)從現(xiàn)在起一到三年內(nèi)需要多少容量是一項(xiàng)艱巨的任務(wù)。
長期依賴于一個(gè)供應(yīng)商,你會(huì)失去靈活性,被鎖定,并且可能不得不為不斷變化的需求付出高昂的代價(jià)。
如何應(yīng)對(duì)儲(chǔ)蓄計(jì)劃?最好的解決辦法是完全避免儲(chǔ)蓄計(jì)劃(Savings Plans)!
不要提前購買資源,而是考慮解決云計(jì)算開銷的方法:
第 2 條:落入過度配置的陷阱
當(dāng)團(tuán)隊(duì)選擇的資源大于運(yùn)行工作負(fù)載實(shí)際需要的資源時(shí),就會(huì)發(fā)生過度配置(Overprovisioning)。這背后有一種安全的心態(tài),因?yàn)闆]有人希望自己應(yīng)用程序的運(yùn)行會(huì)受到干擾。
在某些業(yè)務(wù)設(shè)置中,團(tuán)隊(duì)習(xí)慣于獲得超出其工作負(fù)載所需的更多資源,“以防萬一”。雖然從性能角度來看,這種方法對(duì)工程師來說非常有意義,但它會(huì)造成云浪費(fèi),并增加云成本。
過度配置有什么問題?最直接的答案是,它會(huì)導(dǎo)致云浪費(fèi)和不必要的開支,并且這些開支可能會(huì)失控。
從長遠(yuǎn)來看,讓過度配置成為團(tuán)隊(duì)中的一種習(xí)慣是一個(gè)壞主意。如果為了安全起見,你習(xí)慣了選擇比工作負(fù)載所需更大的實(shí)例,那么請(qǐng)考慮一下隨著公司和應(yīng)用程序的增長,這會(huì)發(fā)生什么事情。你將會(huì)收到一份會(huì)讓你付出巨大代價(jià)的賬單。
把這筆錢花在更重要的事情上不是更好嗎?例如,用在應(yīng)對(duì)氣候危機(jī)方面——順便說一下,過度配置正在加劇這個(gè)問題。
如何應(yīng)對(duì)過度配置?通常的做法是投資于定制的監(jiān)控和成本管理解決方案。他們的規(guī)模優(yōu)化建議可以幫助你減少對(duì)過度配置資源的依賴,但你仍然需要手動(dòng)實(shí)施這些建議。
另一種解決方案是自動(dòng)化。自動(dòng)規(guī)模優(yōu)化可以選擇最合適的實(shí)例類型和大小,以滿足應(yīng)用程序的需求,同時(shí)降低成本。
每當(dāng)集群需要額外的節(jié)點(diǎn)時(shí),AI 驅(qū)動(dòng)的實(shí)例選擇算法就會(huì)選擇能夠?qū)崿F(xiàn)最高性能的資源。
最棒的是,你的團(tuán)隊(duì)不需要?jiǎng)右桓种福驗(yàn)橐磺卸际亲詣?dòng)發(fā)生的。
由于過度配置與許多組織的文化交織在一起,因此必須建立成本優(yōu)化例程以平衡性能、可靠性和成本。在實(shí)現(xiàn)更廣泛的組織變革的道路上,自動(dòng)化可能是向前邁出的重要一步。
第 3 條:被孤立的云資源所困擾
為項(xiàng)目啟動(dòng)一個(gè)實(shí)例,但最后忘記關(guān)閉它是很容易發(fā)生的。
因此,許多團(tuán)隊(duì)都在努力處理沒有所有權(quán)但仍會(huì)繼續(xù)產(chǎn)生成本的孤立實(shí)例。
還記得 Adobe 的錯(cuò)誤,即每天花費(fèi) 80,000 美元計(jì)劃外的 Azure 費(fèi)用嗎?這是一類你必須要避免的問題。
這一問題在大型組織中尤為嚴(yán)重,因?yàn)檫@些組織同時(shí)執(zhí)行了許多活動(dòng),而沒有實(shí)現(xiàn)集中的資源可視化。
在 IT 部門不知情的情況下(影子 IT)管理的活動(dòng)可能占公司所有 IT 支出的 40%。此外,研究表明,影子云的使用量可能是已知云使用量的 10 倍。
孤立的云資源有什么問題?孤立的云資源意味著資金的流失,具有復(fù)雜的可持續(xù)性影響。
簡(jiǎn)而言之,數(shù)據(jù)中心消耗了大量的電力和硬件,大大增加了 ICT 行業(yè)的碳足跡(Carbon Footprint)。他們需要的能源量每四年翻一番,而 AWS 或 Azure 等供應(yīng)商開放的每個(gè)新區(qū)域都會(huì)加劇這個(gè)問題。
這就是為什么減少云浪費(fèi)是停止不必要的開支和相關(guān)碳足跡的關(guān)鍵。
如何應(yīng)對(duì)這一挑戰(zhàn)?確保只運(yùn)行真正需要的資源可能很有挑戰(zhàn)性,特別是在大型組織中。但是,如何識(shí)別并停用未使用的實(shí)例呢?這就是自動(dòng)化再次發(fā)揮作用的地方了。
自動(dòng)化的云優(yōu)化解決方案可以隨時(shí)不斷掃描你的使用效率,并盡可能壓縮資源。它們還可以關(guān)閉未使用的實(shí)例和進(jìn)程,以降低云成本。
第 4 條:管理需求量峰谷值的效率低下
構(gòu)建過電子商務(wù)基礎(chǔ)設(shè)施的工程師非常清楚事物的變化有多快。例如,一個(gè)影響因素的提及可能意味著數(shù)百萬的新銷售額,或者網(wǎng)站在流量激增時(shí)出現(xiàn)下滑。
大多數(shù)其他的應(yīng)用程序也會(huì)隨著時(shí)間的推移而發(fā)生使用情況的變化,但在開支和性能之間取得平衡仍然是一個(gè)持續(xù)的難題。
如果你將標(biāo)簽頁始終保持打開狀態(tài),流量峰值可能會(huì)產(chǎn)生大量且無法預(yù)料的云賬單,如果你嚴(yán)格限制應(yīng)用程序的資源,流量峰值會(huì)導(dǎo)致應(yīng)用程序崩潰。
當(dāng)需求量較低時(shí),你將面臨多支付的風(fēng)險(xiǎn)。當(dāng)需求量很高時(shí),你提供給客戶的服務(wù)可能會(huì)很差。
是的,有云成本管理解決方案可以監(jiān)控你的使用情況,如果超過設(shè)定的水平或出現(xiàn)任何異常,會(huì)實(shí)時(shí)向你發(fā)出報(bào)警。這些工具可以為你提供有用的建議,幫助你根據(jù)當(dāng)前需求量調(diào)整云資源。
然而,手動(dòng)伸縮云容量既困難又耗時(shí)。
除了要注意跟蹤系統(tǒng)中所發(fā)生的一切外,你通常還需要注意:
如何解決這個(gè)問題?這是云自動(dòng)化可以發(fā)揮作用的另一個(gè)領(lǐng)域,可以幫助你節(jié)省大量的時(shí)間和金錢。
自動(dòng)伸縮可以自動(dòng)處理上面列出的所有任務(wù),并控制云成本。如果使用容器編排器 Kubernetes,你可以從三個(gè)內(nèi)置機(jī)制中受益。
在像 CAST AI 這樣的解決方案中,你只需要定義你的水平和垂直自動(dòng)伸縮策略,自動(dòng)優(yōu)化工具則會(huì)為你處理其余的工作。
第 5 條:沒有利用競(jìng)價(jià)實(shí)例的機(jī)會(huì)
云服務(wù)供應(yīng)商以極低的價(jià)格出售其未使用的容量,尤其是當(dāng)你將該成本與常規(guī)的按需付費(fèi)進(jìn)行比較時(shí)。
在 AWS 中,競(jìng)價(jià)實(shí)例(Spot Instance)可享受高達(dá) 90% 的折扣。
競(jìng)價(jià)實(shí)例有什么棘手問題?由于你競(jìng)標(biāo)的是空閑的計(jì)算資源,因此你永遠(yuǎn)不知道這些容量究竟能保持多長的可用時(shí)間。有些競(jìng)價(jià)實(shí)例帶有預(yù)定義的持續(xù)時(shí)間;例如,AWS 提供了一種類型,可以為你提供長達(dá) 6 小時(shí)的不間斷時(shí)間保證。
但除此之外,供應(yīng)商可以回收你正在使用的競(jìng)價(jià)實(shí)例,并僅提前 30 秒到 2 分鐘的時(shí)間通知到你。
人類沒有足夠的時(shí)間做出反應(yīng)。創(chuàng)建一個(gè)新的虛擬機(jī)也需要更多的時(shí)間,因此你面臨著潛在的宕機(jī)風(fēng)險(xiǎn)。
這就是為什么如果你決定使用競(jìng)價(jià)實(shí)例,你需要接受這樣一個(gè)事實(shí),即中斷必然會(huì)發(fā)生。對(duì)于至關(guān)重要或無法忍受的工作負(fù)載,它們顯然不是正確的選擇。
如何應(yīng)對(duì)這一挑戰(zhàn)?盡管存在風(fēng)險(xiǎn),但競(jìng)價(jià)實(shí)例非常適合無狀態(tài)且可擴(kuò)縮的服務(wù)(即具有多個(gè)副本)。幸運(yùn)的是,在現(xiàn)代架構(gòu)中,大多數(shù)服務(wù)都是無狀態(tài)的,因?yàn)?Kubernetes 就是為這種類型的設(shè)置而設(shè)計(jì)的。
使用競(jìng)價(jià)實(shí)例的過程如下所示:
你可以手動(dòng)完成這些步驟,但要使這一切能正常運(yùn)行,需要準(zhǔn)備大量配置、設(shè)置和維護(hù)任務(wù)。
這就是自動(dòng)化能再次派上用場(chǎng)的地方了。除了上述過程之外,當(dāng)你需要的競(jìng)價(jià)實(shí)例暫時(shí)不可用時(shí),自動(dòng)化解決方案可以立即提供幫助。
競(jìng)價(jià)回退(Spot fallback)之類的解決方案通過將受影響的工作負(fù)載臨時(shí)轉(zhuǎn)移到按需節(jié)點(diǎn)上,并在競(jìng)價(jià)節(jié)點(diǎn)可訪問時(shí)將其自動(dòng)返回到競(jìng)價(jià)實(shí)例來保證容量。CAST AI 的功能目前支持 EKS、Kops 和 GKE 集群。
第 6 條:延遲采用自動(dòng)化云優(yōu)化
在本文中,我已經(jīng)提到了自動(dòng)化云優(yōu)化,這是有原因的。
如果你已經(jīng)采用了云原生技術(shù),那么你正在運(yùn)行 Kubernetes,甚至可能使用現(xiàn)代的 DevOps 方法——自動(dòng)化這部分基礎(chǔ)設(shè)施絕對(duì)是一個(gè)好主意。
云自動(dòng)化被列為德勤(Deloitte)2021 年及以后的最大趨勢(shì)之一,為 IT 團(tuán)隊(duì)帶來了切實(shí)的成果,尤其是在大型企業(yè)環(huán)境中。
首先,它減少了你在配置虛擬機(jī)、創(chuàng)建集群或選擇正確資源等方面所需的手動(dòng)工作。這一變化節(jié)省了時(shí)間,讓工程師可以專注于更重要的任務(wù)、創(chuàng)新并更充分地利用云基礎(chǔ)設(shè)施。
更重要的是,自動(dòng)化工具允許更頻繁的更新,這是持續(xù)部署理念的關(guān)鍵。它還降低了人為錯(cuò)誤的可能性,降低了基礎(chǔ)設(shè)施成本,提高了系統(tǒng)的安全性和彈性,并增強(qiáng)了備份流程。
最后,自動(dòng)化使你能夠了解整個(gè)公司正在使用的資源,否則這些資源將難以控制。簡(jiǎn)而言之,云自動(dòng)化已經(jīng)成為科技行業(yè)的新常態(tài)。
如果云自動(dòng)化帶來了許多無可爭(zhēng)議的優(yōu)勢(shì),而且似乎是不可避免的,那么為什么不是所有的企業(yè)都欣然接受它呢?自動(dòng)化可能會(huì)帶來許多挑戰(zhàn),從對(duì)新解決方案的抵制,到對(duì)實(shí)施成本過高的擔(dān)憂,再到更新現(xiàn)有流程的需要。
與大多數(shù)數(shù)字化轉(zhuǎn)型項(xiàng)目一樣,成功的關(guān)鍵在于人,并鼓勵(lì)在人的層面上進(jìn)行變革。說到工作場(chǎng)所,麥肯錫(McKinsey)的研究證明,工人們普遍擔(dān)心會(huì)被技術(shù)所取代。
然而,自動(dòng)化帶來的好處遠(yuǎn)遠(yuǎn)大于風(fēng)險(xiǎn)。例如,在《2021 年 DevOps 狀況報(bào)告》(State of DevOps Report)中,97% 的受訪公司認(rèn)為自動(dòng)化提高了他們的工作質(zhì)量。
在 2022 年推遲采用云自動(dòng)化等于錯(cuò)過了以下好處:
如何克服人類對(duì)變革和新解決方案的抗拒,這是一個(gè)由來已久的問題。提醒團(tuán)隊(duì)自動(dòng)化云優(yōu)化能使他們從重復(fù)性的任務(wù)負(fù)擔(dān)中解脫出來,這可能還不夠。展示和體驗(yàn)總是比講述更好。希望你能在 2022 年享受到自動(dòng)化云優(yōu)化帶來的好處。
原文鏈接:
https://cast.ai/blog/6-top-cloud-cost-optimization-issues-to-avoid-in-2022-and-how-to-deal-with-them
馬楠
版權(quán)所有 未經(jīng)許可不得轉(zhuǎn)載
增值電信業(yè)務(wù)經(jīng)營許可證備案號(hào):遼ICP備14006349號(hào)
網(wǎng)站介紹 商務(wù)合作 免責(zé)聲明 - html - txt - xml