• 手动测试无法被取代的13个重要理由

    如果你想让触摸屏手机减少宕机的次数,进行手动测试是非常重要的。12.手动测试的通过率更高在测试中通过与否是需要考量的,我们要求自动测试软件一边模拟使用,一边呈现所有的测试结果。但对于大多数项目来说,可能...
    文章 2017-10-03 824浏览量
  • 手动测试无法被取代的13个重要理由

    如果你想让触摸屏手机减少宕机的次数,进行手动测试是非常重要的。12.手动测试的通过率更高在测试中通过与否是需要考量的,我们要求自动测试软件一边模拟使用,一边呈现所有的测试结果。但对于大多数项目来说,可能...
    文章 2017-08-01 937浏览量
  • IaaS vs PaaS vs CaaS——哪种云架构适合你?

    许多CaaS方案在他们自己的硬件上运行所有的管理系统,你自己的服务器上只是运行某个代理程序来连接他们的API,因此如果他们的系统宕机后你的集群将无法工作。允许你在防火墙后运行整个系统的方案是非常复杂的,需要...
    文章 2017-10-11 2497浏览量
  • 玩转ECS第3讲|ECS自助服务之智能诊断和自动化修复

    接下来,进行数据处理,特征数据进入到实时预测模型中,进行非预测宕机模型、可预测宕机模型、混合模型、高准确率、高召回模型;下一步进入投票模型,投票到各种各样的优先级的sls预测数据中,当precision大于50%时...
    文章 2020-10-28 3610浏览量
  • 读《大型网站技术架构》

    2)服务器越多,宕机的概率越大 常用的分布式方案: 1)分布式应用和服务;2)分布式静态资源;3)分布式数据和存储;4)分布式计算;5)分布式配置、分布式锁、分布式文件系统。集群,即多台服务器部署相同的应用,...
    文章 2017-04-09 986浏览量
  • Kubernetes是否存在“杀敌一千,自损八百”的问题?

    运维咨询:利用我们数十年的运维专业知识帮助您完成云端迁移,让你的架构拥有自动化能力并将你的SaaS与Web应用提升至新的水平。运维服务:与专家合作维护你的运维平台,同时负责各类日常运营问题——这意味着您不再...
    文章 2017-10-11 1316浏览量
  • 开源AIOps数据中台搭建

    SLA表示客户与服务商之间服务可用性的承诺,一般以服务可用性用时长为维度,例如99.99%可用,表示一个周期(例如一个月)宕机的总体时间不超过0.01%*365天<4.5分钟。有时也表示API错误率占比。IT运维挑战 但是IT...
    文章 2019-12-31 7325浏览量
  • 数据和云

    Sentinel 切换功能主要依赖 down-after-milliseconds 和failover-timeout 两个参数,down-after-milliseconds 决定了Sentinel 判断 Redis 节点宕机的超时,知乎使用 30000 作为阈值。而 failover-timeout 则决定了两...
    文章 2018-10-11 1680浏览量
  • 那些年用过的Redis集群架构(含面试解析)

    工作原理就是,当Master宕机的时候,Sentinel会选举出新的Master,并根据Sentinel中client-reconfig-script脚本配置的内容,去动态修改VIP(虚拟IP),将VIP(虚拟IP)指向新的Master。我们的客户端就连向指定的VIP即可...
    文章 2019-02-22 4177浏览量
  • 知乎技术分享:从单机到2000万QPS并发的Redis高性能...

    5)Sentinel 切换功能主要依赖 down-after-milliseconds 和 failover-timeout 两个参数,down-after-milliseconds 决定了 Sentinel 判断 Redis 节点宕机的超时,知乎使用 30000 作为阈值。而 failover-timeout 则...
    文章 2018-09-18 3031浏览量
  • 打鸡血的开源遇到存储,是什么样的一种体验?

    对于企业的关键应用,必须为用户的这个数据去负责,如果这个软件不是自己写的话,如果哪天宕机的话,你能不能有把握恢复这个数据,这也是包括宏杉、达沃时代等存储厂商自己研发代码,一行一行写的原因。“因为任何...
    文章 2017-08-01 1093浏览量
  • Linux运维工程师的一天是如何度过的

    看看服务器日志,我们这边服务器老是宕机原因层出不穷,然后QA、PO会有一堆问题问你,让你看看是怎么回事儿。期间会有各种会议,需要你坐在那儿聆听。最大的一部分工作就是自动化运维工具的开发。赶上版本发布,...
    文章 2017-11-27 1956浏览量
  • DevOps:软件架构师行动指南1.2 为什么是DevOps

    因为升级失败而导致宕机或故障的例子有很多,这只是其中的两个。在一个组织中,正确的部署升级是大型且重要的活动,并且这种活动应该快速完成,并将出错概率降到最低。有几个组织调查了部署的问题。我们报告其中的两...
    文章 2017-05-02 1575浏览量
  • Mocha BSM应用管理——数据库监控与管理

    提供宕机的根本原因分析,帮助管理员更快解决问题,使最终用户得到更高品质的应用服务。一旦系统发生故障,系统生成事件,通过短信,邮件和语音等方式通知关键管理人员。我们给客户带来什么提高管理员的工作效率,...
    文章 2017-11-08 884浏览量
  • 带你读《企业私有云建设指南》之二:企业云计算涉及的...

    高可用性即在硬件出问题时保证虚拟机的正常工作,当然如果真的出错了,则只能在不同的ESXi主机上启动虚拟机,这也可能造成服务的中断。FT(容错)的主要功能就是保证在出现故障时用户的应用不会出现中断。其原理就是...
    文章 2019-10-31 2935浏览量
  • 血泪总结!创业公司CTO要避免哪些坑?

    先让我从印象最深的一次宕机讲起。有一天,有一台机器的容器挂了,我对技术人员说,你把机器重启一下吧!然后他就去了。结果没几秒钟,突然收到报警。我问那位同事,你做了什么?他反问,你不是让我重启服务器吗?...
    文章 2017-06-12 34250浏览量
  • 如何应对数据中心突发事件(下)

    对于不可预见的问题,故障、危险可导致人身伤害或宕机的情况,都需有应对措施。表3 所有事件应根据严重程度分配“等级”级别,第1级是最严重的,第5级是最不严重的级别。事件类的摘要定义如下: 第1类:人身安全 ...
    文章 2017-07-04 1659浏览量
  • 分布式存储系统基础

    引发服务器宕机的原因有很多,例如内存错误、服务器停电等等。服务器宕机可能随时发生,当发生宕机时,节点无法正常工作。服务器重启后,节点将失去所有的内存信息。因此,设计存储系统时需要考虑如何通过读取持久化...
    文章 2017-08-09 1649浏览量
  • 中小型企业运维之路

    再比如,曾发生某区域因代码更新问题,导致该区域大面积宕机,影响包括消息队列等在内的大量产品异常,如果这时候我们把所有的都交给产品,平台的问题就会导致企业运营的业务全面宕机,而平台方也仅仅会按照产品宕机...
    文章 2019-09-12 1275浏览量
  • 无需深厚技术背景,也可以做好系统和应用维护管理

    所以在现实情况中,经常出现服务器宕机或者服务器上的应用不能访问,运维人员往往无法第一时间知晓,而是由实际使用服务器或使用应用的人去通知,此时业务可能已经停止了很长时间,这对于企业来说无疑是很大的损失,...
    文章 2017-11-11 1106浏览量
  • 基于Kubernetes的PaaS平台设计和思考

    高可靠性,容器的故障恢复,当服务器宕机时,平台系统会自动在其它服务器上重新启动容器并为其分配资源,从而达到秒级启动,恢复业务。保障业务不掉线,高可靠运行;镜像仓库的可靠性,通过将单机版的镜像仓库扩展成...
    文章 2017-10-11 4357浏览量
  • 《Hadoop与大数据挖掘》——第2章 大数据存储与运算...

    第二名称节点的作用在于为HDFS中的名称节点提供一个Checkpoint,它只是名称节点的一个助手节点,这也是它在社区内被认为是Checkpoint Node的原因。如图2-3所示,只有在NameNode重启时,edits才会合并到fsimage文件中...
    文章 2017-07-03 2215浏览量
  • 什么是BSM?

    以前,IT部门只关注物理机器和软件与硬件的可用性,当出现宕机故障时,一方面IT部门无从判断整个事件对业务造成的影响,另一方面受到影响的业务部门面对着复杂的IT系统,只能望而却步。BSM的出现,融合了IT管理和...
    文章 2017-11-09 998浏览量
  • 读《SRE:Google运维解密》一点思考

    SRE在Google不负责某个服务的上线、部署,SRE主要是保障服务的可靠性和性能,同时负责数据中资源分配,为重要服务预留资源,SRE并不负责某个业务逻辑的具体编写,主要负责在服务出现宕机等紧急事故时,可以快速作出...
    文章 2019-12-16 3111浏览量
  • 为什么工厂老板们从不「迷信」人工智能?

    终极梦想当然是实现「三个零」——零宕机、零缺陷、零浪费。而这三个目标分别对应着的「效率、质量、成本」决定了一家企业的生存能力。金超认为&xff0c;在这三点上目前做的最好的制造类行业之一&xff0c;莫过于「半导体...
    文章 2021-11-30 19浏览量
  • 以太坊开发入门,如何搭建一个区块链DApp投票系统

    在网络中成百上千的电脑上,都可以运行该应用的副本,这使得它几乎不可能 出现宕机的情况。基于区块链的投票是完全去中心化的,因此无须任何中心化机构的存在。第三节 开发迭代 涵盖应用开发的整个过程,我们将通过...
    文章 2018-03-22 4596浏览量
  • 如何用智能工业体制抓住制造业的红利?

    随着人力成本的提高,原本应急式的设备服务让设备服务商难以为继,各类设备制造商希望通过远程故障诊断和远程监控来预防设备宕机,传统的工业正在被互联网平台企业吞噬,工业企业急切需要往智能化转型,但是大部分人...
    文章 2019-08-26 1330浏览量
  • 生产环境 VS 开发环境,关于Kubernetes的四大认识误区

    Wei Lien Dang,StackRox的产品副总裁认为“开发测试环境和生产环境的最大不同源自于运维和安全,在运维测试环境你根本不用在乎集群宕机。Portworx的联合创始人兼CEO Murli Thirumale将开发测试环境和生产环境的不同...
    文章 2018-12-18 8845浏览量
  • 《架构师》反思:系统可靠性

    但是可能会导致“单点错”,即系统中某一部件或某个应用程序发生故障时,导致所有系统全部宕机。如磁盘阵列如果出错,可能会导致存储的数据全部丢失。特点:性能较高、可能导致单点错误。(3)光纤通道双机双控集群...
    文章 2016-05-05 4959浏览量
  • 《架构师》反思:系统可靠性

    但是可能会导致“单点错”,即系统中某一部件或某个应用程序发生故障时,导致所有系统全部宕机。如磁盘阵列如果出错,可能会导致存储的数据全部丢失。特点:性能较高、可能导致单点错误。(3)光纤通道双机双控集群...
    文章 2017-11-08 1019浏览量
1 2 3 4 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化
http://www.vxiaotou.com