扫二维码与项目经理沟通
我们在微信上24小时期待你的声音
解答本文疑问/技术咨询/运营咨询/技术建议/互联网交流
本篇文章为大家展示了RAC重构类型是怎么样的,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。
创新互联建站专注于企业营销型网站建设、网站重做改版、延津网站定制设计、自适应品牌网站建设、html5、商城网站定制开发、集团公司官网建设、外贸网站制作、高端网站制作、响应式网页设计等建站业务,价格优惠性价比高,为延津等各大城市提供网站开发制作服务。
RAC隔离体系可分为3层:DB层,clusterware层和OS层
每一层都提供了机制用于保证RAC正常工作,每一层也都可引发RAC重构;
DB层
由LMON进程维护,其提供了CGS和NM两个服务,CGS位于NM之上
NM:每个instance的所有进程被看作一个组注册到clusterware,其中LMON为主进程;其为DB和clusterware的通信通道,同时负责和其他节点NM定期通信;
Instance正常启动或关闭时,其NM向clusterware进行注册或取消注册,同时通知其他节点的NM,然后由NM通知CGS负责重构;
Startup/shutdown normal --〉 local NM--〉 remote NM --〉 remote CGS --〉GCS/GES reconfiguration
如果instance异常关闭或LMON/LMS/LMD通信超时,则需要由CGS进行IMR,将重构的结果记录到控制文件的CFVRR字段(control file vote result record),由各instance读取该字段以获悉自己是否被驱逐
Shutdown abort/ipc timeout --〉 IMR --〉 control file
由上所述,DB层由于timeout引发重构可分为两种:
LMON通信超时:默认300秒,因LMON/LMS/LMD通信异常导致
NAME VALUE ISDEFAULT ISMOD ISADJ
-------------------------------------------------- ------------------------- --------- ---------- -----
_cgs_send_timeout 300 TRUE FALSE FALSE
控制文件超时:默认900秒,ckpt每3秒更新一次控制文件,如果超过规定时间仍无相应则会触发IMR
NAME VALUE ISDEFAULT ISMOD ISADJ
-------------------------------------------------- ------------------------- --------- ---------- -----
_controlfile_enqueue_timeout 900 TRUE FALSE FALSE
另据What is Split Brain in Oracle Clusterware and Real Application Cluster [ID 1425586.1]记载
Controlfile is used similarly to voting disk in clusterware layer to determine which instances survive and which instances evict. The voting result is similar to clusterware voting result
控制文件在RAC层充当voting disk的角色
Clusterware层
由OCSSD负责,其提供两种心跳机制,分别为network heartbeat和disk heartbeat,其参数值分别如下
[oracle@ ~]$ crsctl get css disktimeout
CRS-4678: Successful get disktimeout 200 for Cluster Synchronization Services.
[oracle@ ~]$ crsctl get css misscount
CRS-4678: Successful get misscount 30 for Cluster Synchronization Services.
网络心跳超时会导致集群被分隔成n个子集群,拥有节点数最多的子集群最终获取控制权,其余节点会被剔出重启(11R2引入新机制取代了fast reboot);
The group with lower node member in case of same number of node(s) available in each group
如果两个子集群节点数一样多,用于较低节点号的子集群会最终存活
磁盘心跳超时:如果ocssd没有在规定时间内更新voting disk则oracle认定其offline,如果offline数量大于online数量该节点则会被驱逐;
OS层
Hangcheck-Timer:用于检测linux是否hang
Oprocd:10204起linux引入此进程,每1秒执行一次检查,如果失败则sleep 500毫秒后继续尝试;11R2起被cssdagent替代;
上述内容就是RAC重构类型是怎么样的,你们学到知识或技能了吗?如果还想学到更多技能或者丰富自己的知识储备,欢迎关注创新互联行业资讯频道。
我们在微信上24小时期待你的声音
解答本文疑问/技术咨询/运营咨询/技术建议/互联网交流