• 数据中心NFV技术可靠性研究

    通过对虚拟机进行热备份,专有设备备份及建立通用备份池对多个网元的虚拟机进行备份的方式,提高网元可靠性。还要在故障检测上下功夫。比如支持黑盒故障的检测,支持未知错误的监测,检测时间要快,还有就是可扩展性...
    文章 2017-08-01 1424浏览量
  • 阿里云网络双十一的定海神针-智能网络平台齐天

    网络当中故障随时可能会发生,一台设备的故障,一根线路的异常,甚至一个端口的问题,都有可能导致网络故障的发生,而一旦网络发生故障,引起的蝴蝶效应则是大面积的上层业务和应用出现问题。很明显,双11期间我们是...
    文章 2019-11-20 4061浏览量
  • 走近华佗,解析自动化故障处理系统背后的秘密

    MaxCompute:阿里云数加-大数据计算服务,华佗用MaxCompute进行大规模系统和故障的数据挖掘,用以提高故障检测准确率和预测故障发生。阿里云数加-大数据计算服务MaxCompute产品地址:...
    文章 2016-12-18 4999浏览量
  • ?分布式系统与单节点系统的本质区别是什么?

    我们需要定义一个故障模型并描述故障可能发生的方式&xff0c;然后再决定如何处理它们。如果系统在故障发生时仍然能继续正常运行&xff0c;我们将这样的特性称为容错性。故障是不可避免的&xff0c;所以我们需要构建出具有...
    文章 2022-01-25 43浏览量
  • 双11幕后超级英雄:新一代运维的价值

    智能时代的运维不是要让运维人员失业,而是对运维效率的提高有着极大的诉求,比如如何在错综复杂的环境中快速定位问题、root cause、甚至是故障预测,避免发生故障,保障应用稳定性。智能运维要借助数据(运维数据)和...
    文章 2017-11-15 4797浏览量
  • HDFS原理篇

    namenode和secondary namenode的工作目录存储结构完全相同,所以,当namenode故障退出需要重新恢复时,可以从secondary namenode的工作目录中将fsimage拷贝到namenode的工作目录,以恢复namenode的数据 ...
    文章 2017-11-17 1039浏览量
  • 年轻人不讲武德,偷袭阿里的机房

    总会有各种原因和各种理由让一台服务器发生故障的,可能是过载了,可能是老鼠咬线了,可能是冷凝液泄露了,甚至可能是被知乎用户派人炸了。知乎上有人问过一个问题,如果阿里云数据中心崩了或者被人炸了,是不是淘宝...
    文章 2020-11-18 10268浏览量
  • 智能防盗报警系统前端报警设备的选择

    在市场上除了GSM全球移动报警主机可以不使用固定电话线以外,其它报警主机都需要使用城市固有的电话通信线路,这时就产生了防盗报警的隐患——万一电话线被剪断或者电话线路出现故障怎么办?报警主机的无线转发功能...
    文章 2017-07-05 3153浏览量
  • K8s基本概念入门

    k8s是一个编排容器的工具,其实也是管理应用的全生命周期的一个工具,从创建应用,应用的部署,应用提供服务,扩容缩容应用,应用更新,都非常的方便,而且可以做到故障自愈,例如一个服务器挂了,可以自动将这个...
    文章 2018-12-16 1738浏览量
  • 使用手机QQ前要了解的必备常识

    这种情况通常发生在晚上8-10点,这个时间段同时登录的用户很多,会造成服务器繁忙。建议您先在手机腾讯免费wap聊天,稍后再试着登录,或是在非繁忙的时间段登录手机QQ。为什么我的手机QQ在登录时总是显示“网络不...
    文章 2017-11-15 1451浏览量
  • 2017,那些我们一起删库跑路的日子

    3 月 7 日,负责调查此事的工程师发现无法播放的歌曲的数据中缺少了一个针对具体音频数据文件的指针,于是他就修复了这个歌曲的问题。但是,Google 工程师经常喜欢深究问题,也引以为豪,于是他就继续在系统中查找...
    文章 2017-07-17 3387浏览量
  • 一文打尽分布式系统的数据分片难题

    当某个节点故障的时候,能否将该节点上的任务均衡的分摊到其他节点?对于可修改的数据(比如数据库数据),如果某节点数据量变大,能否以及如何将部分数据迁移到其他负载较小的节点,达到动态均衡的效果?数据的...
    文章 2018-09-18 1435浏览量
  • 考拉上“云”的431天:经历了怎样的“脱胎换骨”?

    在同个城市部署两个数据中心的好处在于,可以在一个数据中心发生故障或灾难的情况下,实现用户的“故障无感知”。考拉曾在2019年做过一套方案,发现建设这个能力需要8个月,成本高达上千万元。阿里早已尝试过“同城...
    文章 2020-12-03 476浏览量
  • 【双11背后的技术】万亿交易量级下的秒级监控

    监督主要通过监听Terminated事件实现,Terminated事件会在下游挂掉(不论是该协程挂掉还是所在的机器挂掉或是断等)的时候发送给上游。由于拓扑是提前生成好且具备完备的描述信息,因此每个角色都可以根据拓扑的信息...
    文章 2017-01-12 5745浏览量
  • 使用存储即服务优化混合云平台

    如果内部私有云部分发生故障,那么用户可以将整个工作负载都迁移至公共云且不会丢失服务。这就为用户提供了两个数据管理选项。一个是将主要数据部署在企业内部,然后将数据连续复制至公共云。在云爆发过程中,将数据...
    文章 2017-08-02 1248浏览量
  • 使用存储即服务优化混合云平台

    如果内部私有云部分发生故障,那么用户可以将整个工作负载都迁移至公共云且不会丢失服务。这就为用户提供了两个数据管理选项。一个是将主要数据部署在企业内部,然后将数据连续复制至公共云。在云爆发过程中,将数据...
    文章 2017-10-02 793浏览量
  • Hbase问题汇总与解答

    一个常问的问题就是Master挂掉的时候,Hbase会发生什么事情,因为Hbase客户端是直接和RegionServer进行通信,而且hbase:meta表并没有存在Master节点上,Master只是进行RegionServer的故障恢复和Region的切分,因此在...
    文章 2019-01-31 193894浏览量
  • 关于防御性编程,你应该知道的事

    如果在执行过程中发生错误怎么办&xff1f;与任何未处理的异常一样&xff0c;应用程序通常会崩溃。假设任何异步操作都会成功运行而没有任何错误&xff0c;那么可能会失败。高级语言中一般会采用try catch方式捕获异常处理&xff...
    文章 2022-06-09 65浏览量
  • 微店MySQL自动化运维体系的构建之路

    事实上大部分时候流量都在主库是没问题,如果确实主库压力真的太大怎么办,我们应该及时发现问题并作出应对(方法可以是缓存+拆库)。3、MySQL标准化(带thread_pool 功能MySQL) 数据库版本一致 “相同”的my.cnf...
    文章 2017-05-12 2885浏览量
  • 100个为什么让你了解分布式光伏发电

    29、如果电网停电或发生其他故障,分布式能正常运行吗?电网停电后,分布式光伏发电系统一般都会退出运行,不能正常发电,但在某些极端情况下可能会出现孤岛现象,即电网停电后分布式发电系统仍然带着部分负荷继续...
    文章 2017-07-03 2459浏览量
  • 挖掘机指数"告诉你不一样的中国经济

    一台北京的挖掘机出了故障怎么办?过去要派出工程师实地勘察,费时费力成本高。通过技术研发、攻关,如今的三一重工,在长沙数据中心就可以对故障进行“确诊”并就近派出维修车。设备是否开工、作业时间多长、工作量...
    文章 2017-05-02 2003浏览量
  • 2019阿里云开年Hi购季基础云产品分会场全攻略!

    场景介绍:电商平台快速搭建,云产品随时升级扩容,应对高突发抢购等交易场景专业安全解决方案为电商企业保驾护航,保障业务的稳定、安全产品高效容灾,负载均衡消除单点故障,云数据库高可用性,确保企业数据安全...
    文章 2019-03-11 3959浏览量
  • 《挖掘管理价值:企业软件项目管理实战》一2.2 项目...

    有的时候是偶然发生的,如市场商机或业务部门突然提出一个需求或者是系统突然出现了故障。不管是何种情况,软件开发都不可能一蹴而就,总需要一个或长或短的过程。因此在开始软件项目之前,通常需要一个立项的过程。...
    文章 2017-05-02 1429浏览量
  • ZStack如何实现混合云灾备?看这篇就懂了

    进一步引申下来,在这个“删库跑路”、“误操作导致数据丢失”等消息常年霸占媒体头条的时代,我们需要严肃地思考一个问题:如果被删除的不仅仅是数据库记录,而是真实存储系统的数据,或者存储出了故障怎么办?...
    文章 2017-10-02 2083浏览量
  • orm 对象关系映射

    遇到从中间删的情况怎么办?多重继承怎么处理?(金龙飞) 3、关联映射模式 3.1一对一关联模式:在关联两端各加一列。3.2一对多关联模式:和3.1一样。如果多这端是有序的,还需加入一列表示序号。3.3多对多关联模式...
    文章 2012-09-18 1467浏览量
  • 阿里云技术战略总监陈绪:5G时代哪些核心技术值得关注...

    另外的问题还有硬件批次故障、硬件过保等,长期使用阿里云的客户并没有意识到硬件一直变化,实际上使用多年之后,客户使用的硬件已经改变。由于被我们主动迁移过去,用上了新的硬件,所以用户不会察觉,这是一个硬件...
    文章 2019-07-29 2493浏览量
  • 关于 NIPS 2016 你应该知道的 50 件事情

    是的,可以使用 Bayesian Truth Serum,但假如你不想提问层次困难的问题时,应该怎么办?只要你有多个独立的任务,就可以使用 Correlated Agreement Mechanism,当人们在相关的任务达成协议时,你对其给予奖励;...
    文章 2017-08-01 1141浏览量
  • Storm入门之第四章Spouts

    发生下列情况之一时为组处理失败: 提供数据的spout调用collector.fail(tuple) 处理时间超过配置的超时时间 让我们来看一个例子。想象你正在处理银行事务,需求如下: 如果事务失败了,重新发送消息 如果失败了太...
    文章 2017-05-02 1489浏览量
  • 武林高手?敏捷开发,唯velocity取胜

    测试人员在测试的时候才能测的更加全面,减少产品上线之后的故障。对技术的掌握程度,代码、技术栈熟悉程度 对技术的掌握程度,对代码、所用技术栈的熟练程度也会影响估点的准确度,估点的时候需要将这些因素都考虑...
    文章 2017-06-21 1083浏览量
  • Java后端开发三年的程序员竟然还被JVM难住!...

    JDK 1.8:无永久代,运行时常量池、类常量池,都保存在数据区,也就是常说的空间。但字符串常量池仍然存放在堆上。2.1、程序计数器一块较小的内存空间,是当前线程所执行的字节码的行号指示器,每条线程都要有...
    文章 2022-05-31 38浏览量
1 2 3 4 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化
http://www.vxiaotou.com