Openstack运维手册
2017年7月18日
目录
Openstack运维手册 .............................................................................................................................................. 1 一、 健康检查 ................................................................................................................................................... 4
1、认证模块检查 .......................................................................................................................................... 4 2、计算模块检查 .......................................................................................................................................... 4 3、网络模块检查 .......................................................................................................................................... 5 4、存储模块检查 .......................................................................................................................................... 5 5、镜像模块检查 .......................................................................................................................................... 6 6、检查 Horizon 服务 ................................................................................................................................. 6 7、分布式存储检查 ...................................................................................................................................... 7 二、 运维命令 ................................................................................................................................................... 7
1、虚拟机开通 .............................................................................................................................................. 7 2、安全组管理 .............................................................................................................................................. 8 3、创建和挂载弹性云硬盘 .......................................................................................................................... 9 4、创建网络 ................................................................................................................................................ 10 5、镜像上传与格式转换 ............................................................................................................................ 11 6、虚拟机模板管理 .................................................................................................................................... 11 三、 日志检查 ................................................................................................................................................. 12 四、 常见故障实战模拟 ................................................................................................................................. 13
、虚拟机不通 .............................................................................................................................................. 13 、测试ICMP告警 ....................................................................................................................................... 13 、查找物理机 .............................................................................................................................................. 13 、物理机网络判断 ...................................................................................................................................... 14 、物理机通、承载的虚拟机网络不通 ...................................................................................................... 14 、物理机通、承载的虚拟机网络通 .......................................................................................................... 14 、物理机网络不通 ...................................................................................................................................... 15 、疏散后状态异常 ...................................................................................................................................... 15 、 疏散失败 ................................................................................................................................................ 15 、疏散失败导致任务状态异常 .................................................................................................................. 16
Openstack运维手册 ................................................................................
一、 .............................................................................................. 健康检查
1、认证模块检查 ........................................................................................
2、计算模块检查 ........................................................................................
3、网络模块检查 ........................................................................................
4、存储模块检查 ........................................................................................
5、镜像模块检查 ........................................................................................
6、检查 Horizon 服务 ............................................................................
7、分布式存储检查 ...................................................................................
二、 .............................................................................................. 运维命令
1、虚拟机开通 ............................................................................................
2、安全组管理 ............................................................................................
3、创建和挂载弹性云硬盘 .......................................................................
4、创建网络 ................................................................................................
5、镜像上传与格式转换 ...........................................................................
6、虚拟机模板管理 ...................................................................................
三、 .............................................................................................. 日志检查
四、 ............................................................................. 常见故障实战模拟
、虚拟机不通 ..............................................................................................
、测试ICMP告警 ......................................................................................
、查找物理机 ..............................................................................................
、物理机网络判断 ....................................................................................
、物理机通、承载的虚拟机网络不通.....................................................
、物理机通、承载的虚拟机网络通 .........................................................
、物理机网络不通 ......................................................................................
、疏散后状态异常 ....................................................................................
、 疏散失败 ................................................................................................
、疏散失败导致任务状态异常 ...............................................................
***执行任何openstack命令之前都必须运行openstack的环境变量
source /root/(每次新开控制台窗口必须执行一次)
一、 健康检查
1、认证模块检查
openstack token issue
有输出即可,如输出异常
重启服务即可
service apache2 restart
service memcached restart
2、计算模块检查
nova service-list
所有计算服务的status 必须是 enabled
State 必须是 up
如有服务存在异常,直接重启异常的服务。
service nova-cert restart
service nova-consoleauth restart
service nova-scheduler restart
service nova-conductor restart
service nova-compute restart
3、网络模块检查
neutron agent-list
所有网络服务的alive 必须是:-)
如有服务存在异常,直接重启异常的服务。
service neutron-plugin-openvswitch-agent restart
service neutron-l3-agent restart
service neutron-dhcp-agent restart
service neutron-metadata-agent restart
4、存储模块检查
cinder service-list
所有存储服务的status 必须是 enabled
State 必须是 up
如有服务存在异常,直接重启异常的服务。
service cinder-scheduler restart
service cinder-api restart
service cinder-volume restart
5、镜像模块检查
glance image-list
有输出即可,如输出异常
重启服务即可
service glance-registry restart
service glance-api restart
6、检查 Horizon 服务
ps -ef | grep apache2
如有输出horizon用户执行apache2命令即可
如异常重启memcached
service memcached restart
7、分布式存储检查
ceph –s
Health 必须是 HEALTH_OK
如遇到mon或者osd down
重启对应节点服务即可,查询节点命令
ceph osd tree
重启服务命令
/etc/ceph start
二、 运维命令
1、虚拟机开通
查询现有的虚拟机模拟
nova flavor-list
查询当前的虚拟机镜像
nova image-list
创建虚拟机
Nova boot --flavor name --image name
--nic net-id=4d42b06a-5b86-4d20-a249-4d0e9f7a8162 --security-group default test1
查看虚拟机状态
nova show id
当 vm_state 状态显示为 active 时,说明虚拟机部署完毕,可以使用了
2、安全组管理
创建一个安全组
nova secgroup-create test “this is a test”
查看所有的安全组
nova secgroup-list
向安全组添加规则
允许来自 的 ICMP 和 ssh 流量
nova secgroup-add-rule test
nova secgroup-add-rule test
如果虚拟主机运行 Windows 系统,则添加一条允许建立 TCP 连接的规则
nova secgroup-add-rule test
查看安全组所有配置规则
nova secgroup-list-rules test
从安全组中删除允许来自 的 TCP 流量规则
nova secgroup-delete-rule test
删除安全组
nova secgroup-delete test
3、创建和挂载弹性云硬盘
查看已创建的云硬盘
nova volume-list
创建一块新的云硬盘,名称为 test_disk,大小为 10G
nova volume-create --display_name test_disk 10
查看新创建云硬盘 test_disk 的详细信息
nova volume-show id
**注意:新创建的云硬盘 test_disk ,此时还没有挂载到任何虚拟主机中。
删除新创建的云硬盘
nova volume-delete a6cb97b7-145d-4acc-94ae-e3425d76254e
将新创建的云硬盘 test_disk 挂载到指定的云主机 test 上
nova volume-attach test a6cb97b7-145d-4acc-94ae-e3425d76254e
将云硬盘从云主机 test 上卸载
nova volume-detach test a6cb97b7-145d-4acc-94ae-e3425d76254e
4、创建网络
查看所有的网络
neutron net-list
查看子网设置
neutron subnet-list
创建弹性公网 IP 池
创建一个弹性 IP 给当前租户
nova floating-ip-create ext-net
将 IP 地址分配给虚拟机
5、镜像上传与格式转换
转换成raw格式
qemu-img convert -f qcow2 -O raw *.img *.raw
上传镜像
glance image-create --name \"*.raw\" --file *.raw --disk-format raw --container-format bare –progress
6、虚拟机模板管理
创建虚拟机模板
nova flavor-create test ID ram disk cpu
例:nova flavor-create test 6 512 100 2
查看虚拟机模板状态
nova flavor-list
三、 日志检查
Nova 日志 目录:
/var/log/nova/*.log
Horizon 日志 目录:
/var/log/apache2 /*.log
Cinder 日志 目录:
/var/log/cinder/*.log
Keystone 日志 目录:
/var/log/keystone/*.log
Glance 日志 目录:
/var/log/glance/*.log
Neutron 日志 目录:
/var/log/neutron/*.log
Ceph 日志目录:
/var/log/ceph/*.log
四、 常见故障实战模拟
、虚拟机不通
虚拟机IP不通告警
、测试ICMP告警
首先自行测试IP是否通,也有可能由于网络闪断、或者负载过高导致网络异常,短暂时间会恢复
、查找物理机
如网络确实不通,查找该虚拟机上承载的物理机信息
利用虚拟机IP调命令nova list|grep 筛选出虚拟机名称和ID号
利用ID号,nova show ID 找出承载虚拟机的物理机。
、物理机网络判断
由上图可以看到故障虚拟机上的物理机是comput29,在其所属成都集群上Ping主机,如果通,则进行下一步判断,如果不通,择将虚拟机迁移到其他物理机上,详细操作见后面。
、物理机通、承载的虚拟机网络不通
物理主机是通的,虚拟机不通,可查找承载该物理机上的其他虚拟机网络状态是否一致
,如所有虚拟机都不通,则重启该物理机上的neutron服务。
root@compute2:~# service neutron-linuxbridge-agent restart
等十几秒后再次尝试ping故障虚拟机和其他虚拟机
如未能解决,则迁移。
、物理机通、承载的虚拟机网络通
物理主机是通的,只有这台虚拟机不通,则从web页面进入操作系统,看系统是否卡死、或者系统损坏
如系统卡死,可直接重启启动、看网络状态是否恢复,可进入虚拟机操作系统,ifconfig查看;
如遇系统损坏,暂不处理。
如虚拟机重启后仍无法通,则迁移。
、物理机网络不通
无论物理机是宕机还是网卡异常。直接将物理机上的虚拟机疏散(迁移)出去。
目标主机要在管理程序上找比较空闲的机器进行疏散
疏散后切换到选择的物理机查看迁移后的状态,测试网络是否正常,如不正常则手动重启虚拟机。
、疏散后状态异常
如迁移后虚拟机状态异常,则后台修改数据库。
Mysql -u root -p
Use nova;
update instances set power_state='4',vm_state='stopped' where
uuid='1329434e-715d-48c8-aa80-f066ac809873';
直接启动即可。
、 疏散失败
如果疏散失败,则手动修改数据库进行人工迁移。(疏散失败就是一直在原来的物理机)
修改数据库信息后手动重启虚拟机。
Mysql -u root -p
Use nova;
update instances set
power_state='4',vm_state='stopped',host='compute39',launched_on='compute39',node='compute39' where uuid='1329434e-715d-48c8-aa80-f066ac809873';
、疏散失败导致任务状态异常
如遇到任务一直卡主某个状态,刷新数据库,正常状态是无。
Mysql -u root –p
Use nova;
#update instances set task_state=null;
因篇幅问题不能全部显示,请点此查看更多更全内容