• 为什么系统越简单,宕机时间越少?

    与船舶类似,创业公司无法承受系统宕机的后果。销售、市场营销、网络、客户支持、招聘、产品和其他系统的长时间停滞可能会对增长率造成不可弥补的损害。(虽然在现代船舶上自动化应用很多,但这些只会对做事情所消耗...
    文章 2020-03-25 566浏览量
  • 阿里如何做到百万量级硬件故障自愈?

    对于宕机的机器而言,无法进无盘(ramos)才开【无故宕机】维修工单,这样能够大量地减少误报,减少服务台同学负担。无盘中的压测可以完全消除当前版本的kernel或软件的影响,真实地判断出硬件是否存在性能问题。b....
    文章 2018-11-24 3472浏览量
  • 阿里如何做到百万量级硬件故障自愈?

    对于宕机的机器而言,无法进无盘(ramos)才开【无故宕机】维修工单,这样能够大量地减少误报,减少服务台同学负担。无盘中的压测可以完全消除当前版本的kernel或软件的影响,真实地判断出硬件是否存在性能问题。b....
    文章 2018-11-19 3040浏览量
  • VMware虚拟化之VSA(vSphere Storage Appliance)群集...

    这样,其中任何一台物理主机或者虚拟机断电或者宕机,也不会影响到共享磁盘的VSADs的正常使用。这样的容灾模式是非常安全的。www.it165.net 1.单节点断电故障恢复操作 这里我们已经将10.15.20.103这台主机电源拔下,...
    文章 2017-11-22 1147浏览量
  • 智能平台管理接口(IPMI)

    传统的系统监控管理方法一般是系统管理员定期到机房巡视或者采用PCAnywhere类软件监控,上述方法存在时效性差、服务器宕机后无法追查原因、占用系统资源较多的缺点;IPMI则可实现对服务器系统的实时监控,能够监控...
    文章 2012-12-28 1835浏览量
  • 人工智能如何增强数据中心的安全性

    在互联网快速发展的今天,人工智能和深度学习将成为解析数据中心所生成大量数据的技术保障,通过人工智能可以更有效地管理服务交付,同时减少数据中心宕机等风险。这些都源于交付应用程序工作负载的转变。数据太多?...
    文章 2017-09-07 967浏览量
  • 你知道,人工智能如何增强数据中心的安全性

    在互联网快速发展的今天,人工智能和深度学习将成为解析数据中心所生成大量数据的技术保障,通过人工智能可以更有效地管理服务交付,同时减少数据中心宕机等风险。这些都源于交付应用程序工作负载的转变。数据太多?...
    文章 2018-03-05 986浏览量
  • 网管必读:交换技术简介及应用分析

    并且要求网络系统不宕机,稳定可靠,不间断运行。要在注重考虑高性能、可管理性、高可靠性、适用性和性能价格比的基础上选择产品。2.邮电行业:电信系统由于其经营特点和为公众服务的目的,决定了电信系统机构在地理...
    文章 2017-11-22 769浏览量
  • OpenStack如何实现高可用集群介绍

    系统宕机时间―系统服务无法访问的时间总和。数据丢失―意外删除或破坏数据。高可用性的一个关键方面是消除单点故障(SPOFs)。SPOF是单个的设备或软件故障将导致系统停机时间或数据丢失。为了消除单点故障,必须存在...
    文章 2017-11-27 1286浏览量
  • OpenStack如何实现高可用集群介绍

    系统宕机时间―系统服务无法访问的时间总和。数据丢失―意外删除或破坏数据。高可用性的一个关键方面是消除单点故障(SPOFs)。SPOF是单个的设备或软件故障将导致系统停机时间或数据丢失。为了消除单点故障,必须存在...
    文章 2017-11-15 2269浏览量
  • openStack高可用性和灾备方案

    HA 的计算公式是[1-(宕机时间)/(宕机时间+运行时间)],我们常常用几个 9 表示可用性: 2 个9:99%1%*365=3.65*24 小时/年=87.6 小时/年的宕机时间 4 个9:99.99%0.01%*365*24*60=52.56 分钟/年 5 个9:99.999%0.001%*...
    文章 2017-05-19 1506浏览量
  • openStack灾备方案说明

    HA 的计算公式是[1-(宕机时间)/(宕机时间+运行时间)],我们常常用几个 9 表示可用性: 2 个9:99%1%*365=3.65*24 小时/年=87.6 小时/年的宕机时间 4 个9:99.99%0.01%*365*24*60=52.56 分钟/年 5 个9:99.999%0.001...
    文章 2017-05-22 1145浏览量
  • 理解 OpenStack 高可用(HA)(1):OpenStack 高可用...

    HA 的计算公式是[1-(宕机时间)/(宕机时间+运行时间)],我们常常用几个 9 表示可用性: 2 个9:99%1%*365=3.65*24 小时/年=87.6 小时/年的宕机时间 4 个9:99.99%0.01%*365*24*60=52.56 分钟/年 5 个9:99.999%0.001...
    文章 2017-11-20 2815浏览量
  • 云计算安全解决方案白皮书(一)

    有了虚拟化技术,可以建立不同时间段VM的动态文件镜像,发现宕机,立即启动备份VM,无论是恢复时间,还是最小损失窗口都有大幅度地提升;VM动态迁移,带来的直接问题,就是IP管理。用户访问服务器是通过URL,再定位...
    文章 2017-11-15 1399浏览量
  • 云计算安全解决方案白皮书(一)

    有了虚拟化技术,可以建立不同时间段VM的动态文件镜像,发现宕机,立即启动备份VM,无论是恢复时间,还是最小损失窗口都有大幅度地提升;VM动态迁移,带来的直接问题,就是IP管理。用户访问服务器是通过URL,再定位...
    文章 2017-11-08 1747浏览量
  • 天梭M13为何具有大型水平的高可用性

    RAS特性是主机与一般服务器的主要区别,同时也是主机设计的一个难题,业界产品在技术上普遍具备了超过99.99%的高可用性,但是银行、保险、证券交易所等核心业务系统的宕机事件仍时有发生。100%的可靠是不存在的,但...
    文章 2017-08-02 1468浏览量
  • 云数据中心呼唤安全可控的运维

    2014年4月21日,三星数据中心火灾引发服务器大规模宕机;2015年2月11日国内十大酒店数据因安全漏洞而泄露大量用户隐私……这些频频发生的数据中心安全事件,一直在提醒我们:安全是IDC运维的第一要务。因此,需要在...
    文章 2017-08-02 1253浏览量
  • 云数据中心呼唤安全可控的运维

    2014年4月21日,三星数据中心火灾引发服务器大规模宕机;2015年2月11日国内十大酒店数据因安全漏洞而泄露大量用户隐私……这些频频发生的数据中心安全事件,一直在提醒我们:安全是IDC运维的第一要务。因此,需要在...
    文章 2017-08-02 1616浏览量
  • 云数据中心呼唤安全可控的运维和检测

    2014年4月21日,三星数据中心火灾引发服务器大规模宕机;2015年2月11日国内十大酒店数据因安全漏洞而泄露大量用户隐私……这些频频发生的数据中心安全事件,一直在提醒我们:安全是IDC运维的第一要务。因此,需要在...
    文章 2017-07-03 1501浏览量
  • 云数据中心呼唤安全可控的数据中心运维

    2014年4月21日,三星数据中心火灾引发服务器大规模宕机;2015年2月11日国内十大酒店数据因安全漏洞而泄露大量用户隐私……这些频频发生的数据中心安全事件,一直在提醒我们:安全是IDC运维的第一要务。因此,需要在...
    文章 2017-07-10 1449浏览量
  • 双11黑科技,阿里百万级服务器自动化运维系统...

    用户如果调用API下发命令失败就会找过来让我们查原因,有的时候确实是系统的问题,但也有很多是本身的环境问题,比如机器宕机、SSH不通、负载高、磁盘满等等,百万级规模的服务器,每天百分之一的机器也有一万台,...
    文章 2018-03-13 2577浏览量
  • ITIL部署实施系列之基础架构规划

    在企业IT管理过程中,服务器是关键,服务器承载公司核心业务,不管是基于服务器、客户端,还是基于浏览器、服务器端的应用,所有数据都存放在服务器上,一旦服务器因为软件或者硬件方面的问题导致宕机或服务中断,很...
    文章 2017-11-27 1563浏览量
  • 双11黑科技,阿里百万级服务器自动化运维系统...

    用户如果调用API下发命令失败就会找过来让我们查原因,有的时候确实是系统的问题,但也有很多是本身的环境问题,比如机器宕机、SSH不通、负载高、磁盘满等等,百万级规模的服务器,每天百分之一的机器也有一万台,...
    文章 2017-12-01 12614浏览量
  • 【MOS】RAC 环境中 gc block lost 和私网通信性能问题...

    描述:配置主机防火墙或网络地址转换(NAT)软件-IPFILTER(IPF)也是导致私网通信问题的原因之一。IPF还会导致严重的应用程序性能下降,丢包以及global cache block loss问题.解决:禁用 IPFILTER ...
    文章 2017-06-24 1573浏览量
  • 揭穿数据中心基础设施管理(DCIM)的神秘面纱

    任何有关DCIM投资的成本效益分析都应该考虑到节约资源、减少宕机时间和提高散热效率,这些因素最终将会对投资回报率产生积极的影响。换言之,汲取自本文开头所提到的旧时代机油滤清器的经验在今天的数字时代依然适用...
    文章 2017-07-03 1034浏览量
  • 存储极客|浅析固态介质在存储系统中的应用方式

    【方式4】非易失性写缓存/NVRAM大家都知道分布式系统一般是利用节点间镜像来防止一个节点宕机之后缓存数据的丢失。而如果是所有节点全部掉呢?比如某长时间停电,或者雷击等导致包括UPS在内的全部电力供应中断,...
    文章 2017-08-09 1500浏览量
  • Java生产填坑经历之全面回忆

    为防止数据库CPU资源不足的情况下造成大量数据库正常操作读写超时影响正常交易,情节严重甚至可能发生数据库服务器宕机的风险,笔者当即采取了功能降级的操作,通过临时更改用户菜单权限,将该功能菜单暂时对用户...
    文章 2018-07-31 1168浏览量
  • 云数据库的安全建议

    2011年4月亚马逊公司的EC2、RDS服务器数据库中心运行出现中断,发生了严重的宕机事件。2012年6月亚马逊的AWS又一度中断服务,instagram/pinterest和netflix等均受到影响。2012年8月苹果的icloud云存储系统被黑客入侵...
    文章 2017-09-01 914浏览量
  • 大话Elasticsearch常用操作和核心原理

    最近有朋友问到Elasticsearch的一些问题,所以我这边重新总结了一些关于搜索引擎的底层原理、分布式文档系统、ES的并发控制。一、背景知识 1、搜索的分类 我们想要寻找某些信息的时候,一般会直接去百度、谷歌、搜歌...
    文章 2017-12-26 2469浏览量
  • 品高云七年|第二部:靠谱的云厂商——品高云的发展...

    在品高云1.0中,功能研发重点在控制器的高可用(物理机宕机不影响业务运转)、高效的服务器调度(用轮询、贪婪、集中化、利旧等模式使用服务器)、实现基础云服务(包括云主机EC2、云硬盘EBS和弹性IP等)、实现云...
    文章 2017-07-10 1571浏览量
1 2 3 4 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化
http://www.vxiaotou.com