一文看懂 SAN 网络组成和日常运维
有关光纤交换机的监控,其实如果可以使用产品厂商提供的相关产品应该是最好的,有的产品可以做到基于主机链路,光纤交换机,存储一条完整路径的监控,覆盖范围比较广,实施起来也比较复杂,各位可以根据企业的需求去选择。 存储管理监控: 目前存储管理监控都是基于SMI-S、SNMP、CLI等方式对设备进行数据采集(包括配置、容量、性能、告警等),目前这类产品很多,各厂商都有区别在于设备支持兼容性。 功能:
3、SAN 网络运维常见问题 以下主要介绍来自社区交流的几个比较典型的问题。在此感谢:ACDante,潘延晟,aix7,crystalwmagic,oniontech ,fuwangrong 等各位兄弟分享。 1. SAN网络连接线如何避免乱,如何规划线路连接 布线离不开机房机柜、交换机、设备的安装规划,根据自身环境制定最适合的规划,比如设备安装、交换机是EOR、MOR还是TOR架构、是否有大对数光纤配线架都需要考虑,标签的记录名称是否规范化,机柜、设备、交换机的名称规范化也需要考虑。 2. SAN环境下数据平滑迁移 在条件具备的情况下使用高级工具来配合我们完成迁移工作,迁移工具如: 1)命令 AIX平台上的mirrorvg,migratepv,migratelp,mklvcopy,cplv,backup,restore等 2)存储功能 快照,存储复制,虚拟存储网关等 3. SAN环境故障诊断 1)指示灯 (理解各种指示灯的意义) 2)是否是一个普遍还是独立的问题,例如io问题 例: 曾经遇到一个集群环境下多节点主机io 性能下降,其中最终问题是由于ds8000 一个控制器问题导致。 3)hba卡故障 例:存储端出现告警灯亮,登录storage manager 查看,出现链路切换,由于有过类似经验,直接定位是由于vmware 集群端主机其中hba卡异常导致,直接查看链路状态和hba卡硬件状态,配合查看交换机端口,很快就能定位故障hba 4)扫描问题 例:曾经配置一套集群,集群三个节点,vmware 环境,添加存储器,扫描异常缓慢,本应几秒钟就可以完成的操作持续了将近1分钟,使用效果不好,表现在io和反应问题。最终更换hba卡,扫描立刻正常,各方面均OK。 5)交换机连接异常 例:曾经通过ssh连接配置B24设备,由于该设备一直在使用状态,但是本次连接建立后直接就断,根本连不上,后来通过串口连接也都OK,使用telnet端口和ping ip地址去诊断均显示OK,ssh和telnet 就是登录不上,最终更换一个网线就正常了。 有的时候交换机的telnet服务也会停止响应,需要使用串口登录进去,重启一下telnet服务也是可以解决。 6)SAN网络的两个应用技巧 http://www.talkwithtrend.com/Question/408427 4、总结 本文从大到小,从整体到细节,针对SAN网络进行了介绍和解释,从组成到原理进行适当的分析,并以实例形式分享了在运维工作当中的诸多问题,我们要理解的是: 一个好的规划是好的运维的基础 一个好的监控是运维的保障 一个个细节是我们需要在运维过程中去关注的 一个个故障和经验需要我们去总结和学习 文中所涉及技术和产品请以官方最新信息为准如有任何问题,可点击文末阅读原文到社区原文下评论交流 资料/文章推荐: SAN完全手册,含金量非常高 http://www.talkwithtrend.com/Document/detail/tid/162771
(编辑:南平站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |