|
|
|
|
挪动端

关于通博8888官网运维罕见毛病排查和处置的33个本领汇总

作为linux运维,多几多少会遇见如许那样的题目或毛病,从中总结经历,查找题目,汇总并剖析毛病的缘由,这是一个通博8888官网运维工程师精良的习气。每一次技能的打破,都阅历着苦闷,随同着高兴,可我们照旧执着的持续高兴,从中也积聚了更多的经历,这便是理论赐与我们的丰盛报答。

作者:佚名泉源:马哥通博8888官网运维|2018-03-01 19:40

【新品产上线啦】51CTO播客,随时随地,碎片化学习

 通博8888官网运维罕见毛病排查和处置的33个本领汇总

作为linux运维,多几多少会遇见如许那样的题目或毛病,从中总结经历,查找题目,汇总并剖析毛病的缘由,这是一个通博8888官网运维工程师精良的习气。每一次技能的打破,都阅历着苦闷,随同着高兴,可我们照旧执着的持续高兴,从中也积聚了更多的经历,这便是理论赐与我们的丰盛报答。

上面汇总了我做项目进程能够呈现的毛病及处理办法,看看能否与你有共鸣,并对你有协助?

第一:罕见题目处理集锦

1.shell剧本不实行

题目:某天研发某同事找我说帮他看看他写的shell剧本,生死不实行,报错。我看了下,剧本很复杂,也没有惯例性的错误,报“:badinterpreter:Nosuchfileordirectory”错。

看这错,我就问他是不是在windows下编写的剧本,然后在上传到linux效劳器的……果真。

缘由:在DOS/windows里,文本文件的换行符为rn,而在*nix零碎里则为n,以是DOS/通博8888里编辑过的文本文件到了*nix里,每一行都多了个^M。

处理:

1)重新在linux下编写剧本;

2)vi:%s/r//g:%s/^M//g(^M输出用Ctrl+v,Ctrl+m)

附:sh-x剧本文件名,可以单步实行并回显后果,有助于排查庞大剧本题目。

2.crontab输入后果控制

题目:

/var/spool/clientmqueue目次占用空间超越100G

缘由:

cron中实行的顺序有输入内容,输入内容会以邮件方式发给cron的用户,而sendmail没有启动以是就发生了/var/spool/clientmqueue目次下的那些文件,日积月累能够撑破磁盘。

处理:

1)间接手动删除:ls|xargsrm-f;

2)彻底处理:在cron的主动实行语句后加上>/dev/null2>&1

3.telnet很慢/ssh很慢

题目:

某天研发某同事说10.50拜访10.52memcached效劳非常,让我们反省下看网络/效劳/零碎能否有非常。反省发明零碎正常,效劳正常,10.50ping10.52也正常,但10.50telnet10.52很慢。同时发明该呆板的namesever是不起作用的。

缘由:

becauseyourPCdoesn’tdoareverseDNSlookuponyourIPthen…whenyoutelnet/ftpintoyourlinuxbox,it’lldoadnslookuponyou。

处理:

1)修正/etc/hosts使hostname和ip对应;

2)在/etc/resolv.conf正文失nameserver或许找一个“活的”nameserver。

4.Read-onlyfilesystem

题目:

同事在mysql里建表建不可功,提示如下:

  1. mysql>createtablewosontest(colddname1char(1));  
  2. ERROR1005(HY000):Can’tcreatetable‘wosontest’(errno:30) 

经反省mysql用户权限以及相干目次权限没题目;用perror30提示信息为:OSerrorcode30:Read-onlyfilesystem

能够缘由:

1)文件零碎破坏;

2)磁盘又坏道;

3)fstab文件设置装备摆设错误,如分区款式错误错误(将ntfs写成了fat)、设置装备摆设指令拼写错误等。

处理:

1)由于是测试机,重启呆板后规复;

2)网上说用mount可处理。

5.文件删了磁盘空间没开释

题目:

某天发明某台呆板df-h已用磁盘空间为90G,而du-sh/*表现一切运用空间加起来才30G,囧。

缘由:

能够或人间接用rm删除某个正在写的文件,招致文件删了但磁盘空间没开释的题目

处理:

1)最复杂重启零碎或许重启相干效劳。

2)干失历程

  1. /usr/sbin/lsof|grepdeleted  
  2. ora25575data33uREG65,654294983680/oradata/DATAPRE/UNDOTBS009.dbf(deleted) 

从lsof的输入中,我们可以发明pid为25575的历程持有着以文件描绘号(fd)为33翻开的文件/oradata/DATAPRE/UNDOTBS009.dbf。在我们找到了这个文件之后可以经过完毕历程的方法来开释被占用的空间:echo>/proc/25575/fd/33

3)删除正在写的文件普通用cat/dev/null>file

6.find文件提拔功能

题目:

在tmp目次下有少量包括picture_*的暂时文件,每天早晨2:30对一天前的文件停止清算。之前在crontab下跑如下剧本,但是发明剧本服从很低,每次实行时负载猛涨,影响到其他效劳。

  1. #!/bin/sh 
  2. find/tmp-name“picture_*”-mtime+1-execrm-f{}; 

缘由:

目次下有少量文件,用find很耗资源。

处理:

  1. #!/bin/sh  
  2. cd/tmp 
  3. time=`date-d“2dayago”“+%b%d”`  
  4. ls-l|grep“picture”|grep“$time”|awk‘{print$NF}’|xargsrm-rf 

7.获取不了网关mac地点

题目:

从2.14到3.65(映射地点2.141)网络欠亨,但是从3真个其他呆板到3.65网络OK。

缘由:

  1. #arp  
  2. AddressHWtypeHWaddressFlagsMaskIface  
  3. 192.168.3.254etherincompletCMbond0 

外表景象是呆板主动获取不了网关MAC地点,网络工程师说是网络设置装备摆设的题目,详细不清。

处理:

arp绑定,arp-ibond0-s192.168.3.25400:00:5e:00:01:64

8.http效劳无法启动一例

题目:某天研发某同事说网站前端情况http无法启动,我上去看了下。报如下错:

  1. /etc/init.d/httpdstart  
  2. Startinghttpd:[SatJan2917:49:002011][warn]moduleantibot_moduleisalreadyloaded,skipping  
  3. Useproxyforwardasremoteip:true 
  4. Antibotexcludepattern:.*.[(js|css|jpg|gif|png)]  
  5. Antibotseedcheckpattern:login  
  6. (98)Addressalreadyinuse:make_sock:couldnotbindtoaddress[::]:7080  
  7. (98)Addressalreadyinuse:make_sock:couldnotbindtoaddress0.0.0.0:7080  
  8. nolisteningsocketsavailable,shuttingdown  
  9. Unabletoopenlog[FAILED] 

缘由:

1)端口被占用:外表看是7080端口被占用,于是netstat-npl|grep7080看了下发明7080没有占用;

2)在设置装备摆设文件中反复写了端口,假如在以下两个文件同时写了Listen7080

  1. /etc/httpd/conf/http.conf  
  2. /etc/httpd/conf.d/t.10086.cn.conf 

处理:

正文失/etc/httpd/conf.d/t.10086.cn.conf的Listen7080,重启,OK。

9.toomanyopenfile

题目:

报toomanyopenfile错误

处理:

终极处理方案

  1. echo“”>>/etc/security/limits.conf  
  2. echo“*softnproc65535″>>/etc/security/limits.conf  
  3. echo“*hardnproc65535″>>/etc/security/limits.conf  
  4. echo“*softnofile65535″>>/etc/security/limits.conf  
  5. echo“*hardnofile65535″>>/etc/security/limits.conf  
  6. echo“”>>/root/.bash_profile  
  7. echo“ulimit-n65535″>>/root/.bash_profile  
  8. echo“ulimit-u65535″>>/root/.bash_profile 

最初重启呆板或许实行ulimit-u655345&&ulimit-n65535

10.ibdata1和mysql-bin致磁盘空间题目

题目:

2.51磁盘空间报警,经查发明ibdata1和mysql-bin日记占用空间太多(此中ibdata1超越120G,mysql-bin超越80G)

缘由:

ibdata1是存储款式,在INNODB范例数据形态下,ibdata1用来存储文件的数据和索引,而库名的文件夹里的那些表文件只是构造罢了。

innodb存储引擎有两种表空间的办理方法,辨别是:

1)共享表空间(可拆分为多个小的表空间文件),这个是我们现在少数数据库运用的办法;

2)独立表空间,每一个表有一个独立的表空间(磁盘文件)

关于两种办理方法,各有优劣,详细如下:

①共享表空间:

长处:可以将表空间分红多个文件寄存到差别的磁盘上(表空间文件巨细不受表巨细的限定,一个表可以散布在差别步的文件上)

缺陷:一切数据和索引寄存在一个文件中,则随着数据的添加,将会有一个很大的文件,固然可以把一个大文件分红多个小文件,但是多个表及索引在表空间中混淆存储,如许假如关于一个表做了少量删除操纵后表空间中将有少量清闲。关于共享表空间办理的方法下,一旦表空间被分派,就不克不及再回缩了。当呈现暂时建索引或是创立一个暂时表的操纵表空间扩展后,便是删除相干的表也没方法回缩那局部空间了。

②独立表空间:在设置装备摆设文件(my.cnf)中设置:innodb_file_per_table

特点:每个表都有自已独立的表空间;每个表的数据和索引都市存在自已的表空间中。

长处:表空间对应的磁盘空间可以被发出(Droptable操纵主动接纳表空间,假如关于删除少量数据后的表可以经过:altertabletbl_nameengine=innodb;回缩不必的空间。

缺陷:假如单表添加过大,如超越100G,功能也会遭到影响。在这种状况下,假如运用共享表空间可以把文件离开,但有异样有一个题目,假如拜访的范畴过大异样会拜访多个文件,一样会比拟慢。假如运用独立表空间,可以思索运用分区表的办法,在肯定水平上缓解题目。别的,当启用独立表空间形式时,需求公道调解innodb_open_files参数的设置。

处理:

1)ibdata1数据太大:只能经过dump,导出建库的sql语句,再重修的办法。

2)mysql-binLog太大:

①手动删除:

删除某个日记:mysql>PURGEMASTERLOGSTO‘mysql-bin.010′;

删除某天前的日记:mysql>PURGEMASTERLOGSBEFORE’2010-12-2213:00:00′;

②在/etc/my.cnf里设置只保管N天的bin-log日记

expire_logs_days=30//BinaryLog主动删除的天数

二、毛病排查汇总表

序号

毛病点

剖析与处理

1

通博8888官网零碎装置初始形态时,找不到硬盘,并无法进入下一步装置

进入COMS设置,找到硬盘设置的相干选项,并设置为兼容形式

2

通博8888官网零碎装置时,在硬盘分区完成后,无法持续装置

硬盘分区不契合装置要求,你能够遗忘创立根分区或swap交流分区了,这一点与通博8888零碎的装置有区别

3

通博8888官网零碎装置时,订定装置中,软件包的选择觉得狐疑,装置完成后发明不契合我们的要求,有些组件没有装置,而不需求的组件却装上了

对通博8888官网零碎的理解还太少,重复装置屡次后,天然掌握自若

4

署理效劳器的设置装备摆设进程中,发明有些过滤计划未起作用

(1)先反省对应的功用模块能否加载乐成(2)默许战略能否设置适当(3)iptables下令语法能否有错(4)过滤计划次序能够不妥,需调解

5

署理效劳器和防火墙的设置装备摆设完成后,启动效劳,可以拜访Internet,但不克不及拜访DMZ区的效劳

(1)封闭iptables效劳,看能否可以拜访,假如不克不及,反省连通性,若能拜访,阐明iptables规矩有题目,会合反省过滤规矩的设置装备摆设与次序

6

再次设置装备摆设好iptables过滤规矩后,重启iptables效劳后,发明原有的规矩全部丧失

(1)修正/etc/sysconfig/iptables-config设置装备摆设文件,将IPTABLES_SAVE_ON_RESTART=”no”改为yes(2)用iptables-save > /etc/sysconfig/iptables下令保管

7

在交流机上分别VLAN后,不克不及拜访外网

VLAN的网关未设置或设置不准确

8

在设置装备摆设DNS效劳中,named效劳无法启动

形成题目能够性:(1)/etc/named目次下短少须要文件(2)/var/named目次下短少须要文件(3)named账户权限题目。处理办法:短少的文件必需复制到位,启动文件必需将权限设置为named账户和组账户

9

在设置装备摆设DNS效劳中,无法准确剖析域名或IP地点

(1)反省并修正/var/named下的正向剖析区文件和反向剖析区文件中的语法与记载设置(2)反省/etc/named.conf设置装备摆设中的zone地区声明编写能否有误(3)反省能否装置了bind-chroot软件包,如装置了,地区数据库文件应在/var/named/chroot/var/named目次中(4)反省/etc/resolv.conf设置装备摆设文件能否设定了准确的nameserver

10

dhcpd效劳启动时,提示“No subnet declaration for eth0(10.10.10.2)”

阐明eth0的IP地点设置不合错误,不在dhcp效劳的作用域范畴内,必需将eth0的IP设置为作用域范畴内的IP地点

11

在设置装备摆设DHCP效劳时,设置装备摆设了多个作用域,后果只要一个作用域的地点可以分派,其他不克不及分派乐成

阐明主机的网络接口卡只要一个,若有3个作用域,需设置装备摆设3个网卡接口eth0、eth1和eth2,辨别对应3个作用域。这是运用超等作用域的一种设置装备摆设办法

12

MySQL数据库的装置不克不及乐成,总是提示软件的依赖干系,形成所要装置的软件包不克不及顺遂装置

阐明所要装置的软件包需求其他组件或共享库的支持,MySQL的rpm包装置方法自身就繁琐一些,要求装置的软件包比拟多,包之间的依赖干系十分分明,依据提示找到需求的组件包并装置,装置时要留意软件包次序

13

测试Web效劳,拜访主站点时,无网页呈现,但曾经衔接上效劳器

在httpd.conf主设置装备摆设文件中的“DocumentRoot”选项的设置不妥,如/var/www/html/,最初的“/”不克不及加

14

近程客户端无法拜访samba共享目次,共享目次在当地测试乐成

封闭iptables效劳

15

Samba的smb效劳曾经启动乐成,拜访samba某个共享目次时,提示错误信息“NT_STATUS_BAD_NETWORK_NAME”

阐明共享目次没有创立或不存在

16

Samba的smb效劳曾经启动乐成,提示错误信息“NT_STATUS_ACCESS_DENIED”

提示拜访被回绝,能够是登录的用户名或暗码有误,或是iptables启动了,封闭防火墙

17

Samba的smb效劳曾经启动乐成,提示错误信息“NT_STATUS_LOGON_FAILURE”

不容许以后用户拜访以后共享目次,阐明此共享目次设置只容许特定用户拜访

18

FTP效劳设置装备摆设了当地用户上传,但在上传数据到对应目次时,提示被回绝

能够该用户账户对上传目次没有写权限

19

设置装备摆设容许当地账户登录FTP后,root账户无法登录,并提示“500 OOPS:cannot change directory:/root”的错误信息,而其他当地账户可以登录FTP

反省能否启用了SE通博8888官网平安零碎,并制止SE通博8888官网,可以编辑/etc/selinux/config文件,将设置装备摆设项SELINUX=enforcing改为disabled

20

运用邮件客户端可以发送邮件,但不克不及接纳邮件

反省pop3效劳能否启动

21

mount下令挂载NFS效劳的共享目次,好久也没有呼应,NFS效劳是正常的

portmap效劳没有启动,必需启动该效劳

22

当地测试mount挂载NFS共享乐成,但在其他客户主机mount衔接时不可功

封闭iptables效劳,再测试

【编辑引荐】

  1. 在通博8888官网上装置和运用Docker
  2. 通晓通博8888官网常用的100+下令大全万字详解长文(收藏版)
  3. 怎样在通博8888官网/Unix中不重启Vim而重新加载.vimrc 文件
  4. Kali 通博8888官网 是什么,你需求它吗?
  5. 在通博8888官网上装置必应桌面墙纸改换器
【责任编辑:庞桂玉 TEL:(010)68476606】

点赞 0
各人都在看
猜你喜好

读 书 +更多

英勇者的新天下

这是一个最坏的年月,J2EE Web开辟技能曾经迟滞多年;这是一个最好的年月,J2EE Web开辟技能的新革新留给勇于创新的人! 接纳Apusic Opera...

订阅51CTO邮刊

点击这里检查样刊

订阅51CTO邮刊