构建智能虚拟化数据中心

DELL大中国区首席技术顾问 陈进坤

演讲PPT下载(PDF版本):构建智能虚拟化数据中心

各位来宾大家早上好,首先我先自我介绍,我叫陈进坤是戴尔公司咨询部门的咨询师。今天非常荣幸能在这里跟大家去分享戴尔的智能虚拟化数据中心介绍。

首先我在这里先让大家了解一下什么是智能数据中心?智能数据中心的定义是什么?戴尔内部的解决方案组针对新一代的智能数据中心架构的定义是一个自动化的平台,在这个自动化的平台上需要策略性的针对业务拓展,然后同时它能以客户业务需求为中心去发展的一个平台。新一代的数据中心的是怎么样的?比如说在我们的这个数据中心发生什么问题,或者是发生了什么事件的话,它能做到自我监控和自我调整。然后在同一个时候,在这个数据中心,我们需要有这种无缝的扩展能力,在做这个扩展的时候,我们想看到的这个数据中心,不能停顿而影响业务的继续的运行,所以最终我们想看到的就是要把这个数据中心很复杂的做得非常地简单。同时我们需要把成本降低,但是在这个基础架构再扩展的时候,这是一个非常大的挑战。

我们应该怎么样去实践它呢?我们会针对现在的硬件池的服务器层,存储层,和网络层做这个针对性的虚拟化部署,然后在虚拟化的部署完之后、我们需要拥有有效的软件,通过这个软件做这个硬件的整合,然后在这个硬件整合之后,是不足够的,它只是能运行,我们需要的是一个智能的数据中心,它需要有效的管理模块去结合软件,达到所谓的自动化和策略性的平台。

在刚才我们介绍的虚拟池里面,我们把硬件分成服务器,存储和网络。今天我想在这里跟大家去分享的是在前端服务器和后端存储虚拟化,在这个智能中心它扮演什么角色?首先让我们去探讨究竟在前端服务器虚拟化能提供一个怎么样的自动化的平台?刚才微软和联通介绍了虚拟化能做到所谓的动态的扩展,能做到多变一这种功能。我们能够通过虚拟化的手段很容易地看到我们有效的迅速减少服务器的数量,实现节能减排和空间压缩。

根据我过去6个月的时间,通过戴尔评估服务,我大概亲眼看到600多台物理机器的CPU使用率大概只是少于6%到8%左右。我们有一个客户是国内最大的家电制造商,他们大概320多台的服务器的CPU使用率大概是6%,所以他们当时的CTO和CFO跟我一起在分析这个报告的时候,他们都吓了一跳,他说为什么我们这么多资源完全都浪费,其实不是企业想投这样多的机器进去,其实很多时候每一个项目他们都需要有一个关键的应用,每一个应用都需要有一台服务器,假如说把其他的服务器整合起来,在同一个操作系统上面跑多个应用的话,我们都知道会有很多冲突发生,这会导致我们IT的SLA会降低,这个是很多企业不能容忍的。但是通过今天的前端服务器虚拟化的技术,我们能看到它能做到多变一的这种机制,服务器的数量减少、我们的硬件的投入减少、我们的机房所需的空间减少、我们耗的电幅度地减低,做到一个绿色数据中心。

第二个价值观,今天的虚拟化不单单只发生在服务器,虚拟化已经走到客户端,通过客户端的虚拟化,我们能把这种机密的数据保护得更加地好,怎么样说呢?其实通过虚拟化之后,我们能把无硬盘客户端的硬盘的信息直接上收到数据中心,把数据的安全性大大地提高。相信昨天晚上或者前天晚上大家看CCTV2,大家都在讲315的事件,为什么我们个人的隐私在市场上面随便都能买到,比如说你今天去了医院之后,隔一天就会有人给你打电话推销相关的药品信息。所以针对这些个人隐私,我们需要有针对性地通过这种手段去保护数据,客户端虚拟化是其中很有效的手段。

通过客户端虚拟化,我们也能做到所谓的标准化的几种管理,怎样说呢?因为之前我相信很多的企业,包括今天在座的每一位领导,我相信你们有很多的台式机或者是笔记本现在正分散在全国各地,当你今天要做一个软件升级或者是做一个补丁的升级的时候,当然我们可以通过广域网在一些网络成熟的情况下,通过一些管理手段把它推下去,但是还有很大面积的这些用户,我们现在是查不到的。假如说我们可以通过这种所谓的客户端虚拟化把它上收到个别的数据中心的话,我们在这个标准化的桌面管理的话,就会做得更加地容易。

同一个时候通过虚拟化的封装格式的特性,每一个虚机都是一个文件的格式,我们在做恢复的过程中,针对客户端SLA的这种质量,我们能做得非常地好。比如说以前某一台机器崩溃的话,我们要去重新装一个操作系统,没有通过镜像的这种手段,我们大概是要三个小时到四个小时。假如说经过通过今天的这种客户端虚拟化的技术,结合虚拟化的这种特性,每一台虚拟机都是一个封装的这种格式,我们今天去恢复一台机器可能是三分钟或者四分钟的时间,而且是每一个人通过简单的培训都可以做的事情。

第三个价值观,通过前端服务器虚拟化,今天我们能看到的就是在业务连续性和在线性做得更加地好。在这里我可以跟大家去分享,今天的虚拟化的平台通过在业界很多的虚拟化的软件,我们今天可以做到“虚机在线飘移”的这种技术,通过共享存储技术,结合今天的这种虚拟化的内存飘移这种技术,我们可以在做虚机的迁移的过程中,也就是从一台主机漂移到另外主机的过程中,我们这个服务器的应用运行是不会受到影响的,我们这个网络连接是不会中断的,我们的客户端的连接它是不会受到影响的,所以我们基本能做到零宕机的这种机制,假如在计划内去做这个事情。当然在非计划内去做这个事情的话,今天的虚拟化的平台能通过这种高可靠性的模块,把这个RTO减到更低。当然有很多的业务需要要求到5个9的这种所谓一年当机的时间少于5分钟,我们也能结合第三方的这种集群服务做到5个9的需求。

最后一个虚拟化价值观在这里跟大家分享的在今天的服务器虚拟化平台上面,我们能做到所谓的动态平台,通过这种动态的平台,今天我们按需自动资源调配,过去经常我们做硬件投入的时候,企业都会为这个硬件配置的峰值而去考虑,而这个峰值的发生,在一年以内它可能会发生的只有三次或四次,其他的时间非常闲,通过今天这种服务器虚拟化的资源池这种概念,我们能把多台虚拟主机放在一个资源池里面,然后让这些虚拟机在这个资源池里面,设制一些策略,当某个A虚机峰值发生时,虚机主机将会释放其它虚机飘移到资源池其它的虚机主机, 让A虚机拥有更多资源去应付这个峰值的需求。

前端服务器虚拟化带来很多好处但它也带来了新的后端存储问题。很多的友商他可能都不会去强调后端存储的这种弊病。戴尔强调虚拟化的解决方案是一个端对端的虚拟化的平台,我们提醒我们的客户,前端虚拟化的这种好处,带来后端的这种虚拟化的新问题。传统的光纤存储使用的光纤协议是在OSI第一层和第二层,它是固定的路径和静态的配置,但是我们刚才一直在讲虚拟化的平台是一个自动化的平台时,我们的虚机在未来的日子,会随着时间而推进,而在这个平台上面自动地飘移地时候,我们需要去考虑,后端的这个存储路径是不是也自动能漂移呢。
比如说你去做一个光纤存储的配置的时候,你的卷和你的端口包括从你的端口连接到你服务器的路径,都是固态的。所以有一天当你的业务向前推进的时候,你的业务发生这种变化需要更加多资源的时候,当你的虚机漂移到另外的一台机器的时候,这些路径会随着你而飘吗?不会,因为我们的这个协议在第一层和第二层是固定的,

所以在我们的新一代虚拟化的平台上面去追求这种智能的数据中心,而达到这种端对端的这种虚拟化的平台,我们追求的虚拟化的存储它需要有这种要求。比如在数据层这块的虚拟化存储,我们需要的是一个存储面对业务的这种需求,而不是把磁盘作为中心点或者阵列作为中心点,我们需要做到的就是说,这个虚拟存储它能做到自动内部磁盘优化,它能做到无缝的迁移,它是以业务为中心,而不是以磁盘的技术或者是磁盘为中心。

第二在网络层这块,我们需要的一个存储,我不想看到我的授权工程今天来跟我谈存储的时候,要问我在未来两年到三年,我的存储量需是多少,我的应用的情况是怎么样的?我已经受够了,我需要的是一个动态的这种存储的平台,我需要的是这种符合横向的扩展,对我未来的投资是有所保障的。

在IO的连接层次这一块,我们需要看到的是一个自动网络附载均衡,我们不想看到刚才的胶片上面所看到的链路都是固态的,随着我的业务的扩展,随着我的业务的推进,我的虚拟机需要在平台上自动飘移的时候,我的链路也要随它而飘。

在IO引擎层这块,我们想看到的IO这个引擎它是能做到自我学习、自我管理、自我优化的一个平台,我们要看到的是我们不需要随着业务的拓展,就要一个军队的咨询师进来帮助我们,一直地告诉我们怎么样去做这个事情,根据新一代的智能数据中心为业务去拓展的这种平台上,它是有自我学习和自我优化的功能。

我们一直在谈存储,过去买外挂存储无非就是因为要容量,第二个价值无非是因为性能,今天我们的智能化的数据中心,我们的存储不单单只要满足刚才两个价值观,在容量和性能这块,我们需要在未来的这种虚拟化的存储,在这个智能数据中心上它能满足数据保护这种要求,这个是什么概念?因为今天的数据量我们以海量来计算,我们假如说今天有这样多的数据,备份需要用这样大的窗口,我们恢复需要做到这样长的时间的话,我们去谈这种RTO和RPO还有意义吗?我们在这里想跟大家去分享的,在新一代的这种虚拟化的存储,它需要要有这种连续性的数据保护,通过这种所谓秒级别的这种快照技术,去做这种数据的快照,然后就是这种数据的恢复功能。

当然在最后我们我想跟大家去分享的就是说,在未来的这种虚拟化的存储,它需要在业务的弹性这块,能随着业务的扩展而做得更加地完善。最后我们想看到的就是在IT的投资上面,就是我们在做存储的规划的时候,不会因为开始做错某一样事情,最后我们就没有路可以回头。

通过刚才我在这里跟大家分享的这些东西,最终戴尔是怎么样去实现智能虚拟化数据中心的?其实戴尔在前端也好,在后端存储也好,我们在虚拟化的平台上面,都做出了很多研发,投入了很多的精力,包括我们在前端的这种服务器,我们有针对在虚拟化IO的这种需求,还有内存的扩展的服务器上面做了很多的投入,然后把这个机器推到市场上面。在去年年末的时候,很多企业,在做预算的时候,因为大家都知道虚拟化能做到“化钱去省钱“,所以很多企业都很愿意去做这个事情,所以去年我很多客户都会来找我们的咨询师,听取我们的建议如何推荐虚拟化主机的硬件配制。根据我们的经验,虚拟化的平台上面的主机很多时候它的性能下降是因为IO的瓶颈发生了问题,或者是因为它的内存条的扩展已经到饱和了。其实很多时候CPU不是很关键的问题,关键的问题其实是在我们的IO吞吐量的瓶颈上面,还有我们的内存的扩展能力这一块。所以针对这些问题,DELL在过去6个月到9个月的时间,在市场推出了很多针对虚拟化的这种机器,比如说我们的R9O5,R900或者R805的服务器。戴尔的R905的内存能扩展到256G左右,而且我们的IO插槽相应也比较多,包括我们机器本身就集成了四个以太网口。

然后针对后端的存储虚拟化这块,我们有并行虚拟化存储,它是随着存储的阵列增加的时候,我们的这个性能、我们的带宽、我们的内存和我们的容量能做到所谓的线性增长,然后在中间层有网络层的虚拟化。我们现在知道在市场的趋势,就是通过了这种前端和后端的虚拟化完成这种使命之后,要在中间层的这个网络层这一块,需要结合去做这种端对端的虚拟化的路径。

接下来我很快地跟大家分享,通过虚拟化的这种平台我们能做到所谓的怎么样的资源联机扩展?从这个图面,比如说今天我们有三个虚拟主机在虚拟池,它的资源发生了这种瓶颈的时候,我很容易地再加一台主机进来,然后在这个主机上面我可以用我的这些在线飘移的技术,我不知道在当机的情况下把我的这些业务切割到一台新的主机上面。然后同样的道理假如说今天我的后端的存储在某一个卷上面,它的应用特别凶的时候,我可以针对性的再多带一台存储进来,然后通过这个存储的自我优化的软件,它能把这个卷飘移到适当的阵列上。我们所强调的资源联机的扩展,是没有所谓宕机发生的。

接下来我们看自动工作附载平衡是怎么样实现的?很多的企业我刚才所说我们买新机器的时候,都为我们的峰值而设硬件的配置,假如说今天我在这个虚拟池里的某一台虚机,它发生了所谓的峰值的情况出现的时候,我可以把这个虚机的资源释放,然后让更加多的资源去让这个虚机去使用,同时它把这些其他的机器飘移到另的虚拟主机机器,在虚机飘移的过程中,我们都不会发生所谓服务中断的情况,在后端的存储这一块,我们也能做到自动附载平衡,比如说看到红色的卷特别的忙,可能是在前端的请求特别多的时候,它能做到自我优化,把黄色的卷释放出来,把它自动迁移到另外一台存储上面,然后让这个存储有更加多的资源去应付前端的这个业务的请求。

最后我们去看高可靠性,高可靠性基本我们能做到的就是当这个虚拟主机它发生故障的时候,我们可以通过虚机的封装文件存储在共享存储,在其他的虚拟主机上面做切割,当然我在这里想强调的就是说在切割的时候,它会有一个中断的时间,所以我们需要了解业务的需求,业务假如真的做到不能一分钟不能宕机的话,其实可以在这个虚拟平台上面我们可以结合第三方的所谓的这种集群服务去实现这种无宕机的这种状态。

然后同样的道理在计划内的这种宕机,比如说今天我们针对这台虚拟主机去做补钉升级时候,我可以把这台虚拟主机放进去一个维护模式,通过维护模式它会把这些机器飘移到另外一台主机上面。同样的道理假如说我们的虚拟存储它需要做硬件升级的时候,我们的存储管理介面可以进入清空模式,我可以告诉我们的存储管理软件,把这个存储从虚拟池拿走。然后它就自动的做数据的飘移,在做这个数据飘移的时候,它会按照存储阵列做适当的调整,比如说存储当时是非常忙的话它会在做飘移的时候,飘得特别慢,假如说这个存储特别闲的时候,它就会加速做数据的飘移,当它飘移完之后,它会告诉管理人员我已经清空了,我现在可以退出,你可以把我放去别的地方。传统的存储,你觉得能做到吗?我需要在这里强调以上的数据迁移是无宕机和无影响业务情况下发生的。

我在这里再一次感谢大家的参加,因为今天时间有限,假如有疑问,我们可以稍候在会场继续地聊。谢谢!

演讲PPT下载(PDF版本):构建智能虚拟化数据中心