网络存储_如何租用_为什么要人工智能

2021-03-30 14:20

网络存储_如何租用_为什么要人工智能

关于云迁移的风险和挑战有很多帖子。GlenRobinson(@GlenPRobinson)最近发表的一篇文章对更广泛的云计算迁移的关键风险和挑战进行了精彩的总结。在他的论文中,他引用了安全性、弹性、声誉和监管作为主要考虑因素,其次是从商业角度考虑财务、许可和人才。我想从中抽出两个来仔细检查。安全当然,中国云,安全本身就是一个巨大的话题,而且常常是任何组织不部署到公共云的第一个也是最重要的原因。为了帮助解决这个问题,我们提出了一个共享责任模型的概念。虽然AWS直接使用这个术语,但这并不是AWS所独有的。在双峰环境下(参见之前的博客了解更广泛的观点),有两种不同的方法:公共云提供商(如AWS)负责云的安全客户负责云中的安全性和法规遵从性或者,换句话说,两者之间不应该有灰色地带。使用AWS共享责任模型作为一个很好的参考点;"云"意味着,云提供商确保以下领域的安全,这些领域当然与他们提供的服务直接相关。因此,对于AWS来说,这可以分为两个核心要素:计算、存储网络、数据库区域、可用区域、边缘位置这意味着将为每个组件提供一系列服务,并在其中提供一套非常完整的安全措施和控制。另一个关键点是,这些都是提供程序服务,因此您只能获得所提供的服务。第二个维度,"在云端":是指保护以下区域,这些区域根据其性质和上下文属于客户所有,因此客户完全有责任保护这些区域:客户数据平台、应用程序、IDAM其中很好的例子包括部署web应用程序保护、使用AWS身份和访问管理(IAM)、AWS云跟踪(API跟踪)和Cloudwatch(警报触发)操作系统、网络和防火墙配置这里的例子包括配置AWS安全组(SG)、使用AMI(Amazon Machine Image),包括那些预先强化的,部署vpc客户端、服务器和网络端加密这里最重要的一点是,什么是物联网技术,无论一个组织与哪一个云提供商签约,理解共享责任模型并确保系统中的每个元素都得到了正确的处理是至关重要的。恢复力最近,AWS和Azure都出现了一些引人注目的宕机事件,这可以被称为"消除单点故障"。首先,从逻辑上讲,在设计应用程序时,必须从业务角度理解和认可正常运行时间的要求。定义"高可用性"的要求意味着它可以承受单个或多个组件的故障。业界最常用的两个术语和度量是恢复时间目标(RTO)和恢复点目标(RPO),第一个是进程恢复时间,第二个是数据丢失的长度。为了使解决方案得到正确的设计,达成一致的以业务为中心的目标是必不可少的。此外,(逻辑上)有必要确保业务不会在没有正确上下文的情况下简单地说"它需要100%容错":即业务流程与财务影响相结合。以AWS为例,每个关键构建块都具有提供不同级别的弹性和冗余的功能。这与上面的共享责任模型是一致的,因此,例如,了解Amazon虚拟私有云(VPC)的部署模型和弹性平衡是关键。当然,看到引用的可用性和真实性水平可能很有趣……(注意,引用的S3正常运行时间为99.9999999%)。所以我们看到,如何获得大数据,有很多机制可以消除故障点。请注意,这些并不是公共云提供商独有的,而且在很长一段时间内都是内部架构的面包和黄油……事实上,永远都是。消除故障点的关键重点领域:引入冗余:有两种主要类型,备用和活动。备用是指在故障转移时执行一个进程,而active则自动分配工作负载。通常情况下,备用更易于设计,部署成本更低,因此始终需要权衡成本/收益。故障检测:自动化是这里的热点/关键话题,因为它不仅允许检测,而且允许反应活动发生。这是对故障将发生的认识。因此,你对它们了解得越多,你对它们进行趋势分析(甚至预测)的能力就会增强,你的准备就越充分。有趣的是,更极端的观点是Netflix模型,它不仅可以检测故障,大数据算法,还可以创建故障,以确保应用程序的部署具有适当的恢复能力(混沌猴子)。我喜欢Netflix模型,因为它引入了一种接受基础设施故障的文化,而不是让它感到惊讶的文化。数据存储:每个应用程序的核心都是数据。因此,引入数据冗余副本的数据复制等技术会自动创建较少的故障点。同步复制通常有两种类型:同步复制和异步复制。两者之间的关键区别在于应用程序是必须等待数据写入所有位置(同步),还是继续(异步),显然,由于潜在的延迟问题,这种选择中有一些重要因素。与以往一样,当似乎只有两种选择时,第三种选择是"基于法定人数"的,即前两种选择的混合体。这种选择对于大型分布式数据库特别有用。当然,这不能替代实际的数据备份,这应该是整个灾难恢复计划的一部分。多数据中心恢复能力:传统上,最困难的决定是何时执行故障转移,尤其是在出现短暂中断且中断时间不知道的情况下。在AWS中,由于存在具有不同可用区域的不同区域,因此可以跨数据中心同步复制数据,因此故障可以自动进行,并对最终用户透明。这会造成相当大的成本,因此,首先要了解业务对恢复力的必要性。混合:这是一个被广泛讨论的主题,但对于消除单点故障是一个明确的选择。在这种情况下,混合意味着应用程序不必同时部署在公共和私有基础设施中,但在发生故障时可以跨它们部署。显然这会带来很多额外的参数,一些重要的措施,大数据工具,如确保工作负载能够在两个保持连续同步的环境中实际运行。从表面上看,这是一个非常昂贵的选择,因为从迁移到公共云提供商中获得的所有经济都可能受到辐射。但是,这绝对是一个值得考虑的选择。其他参考文献:AWS灾难恢复格伦·罗宾逊:砰的一声把云吹走了……还是呢云最佳实践构建容错应用程序斯蒂芬·奥班谈混合动力 这篇文章第一次出现在尼尔的博客上。律师尼尔费根尼尔·法根是英国政府全球基础设施服务安全和情报账户的首席技术官。他是一位企业架构专家,领导架构师团队,负责从最初的概念到交付和支持的解决方案。

分享到:
收藏
相关阅读