企业Linux系统的运维成为目前企业关注的重点。作为一种的开源网络操作系统,如何充分利用Linux的工具并使用相应的方法来提高运维效率是非常重要的工作。在第一篇文章中,我们介绍了运维相关的4个应用工具的使用和实战,本文作为该专题的第二篇文章,将着重介绍运维过程中的重要原则和方法,包括如何避免产生问题以及如何解决系统问题的内容,以为企业Linux的实际运维提供有益参考。

  Need to Know I:系统管理员与系统用户增强沟通

  作为一个系统管理员的主要职责之一是与系统用户通信。当为维修系统而停机时,当上线一类新软件以及发布用户如何访问新的系统打印机时,需要发布公告。甚至可以开始充当一个地方小报的角色,让用户知道新员工、RIF、生日、公司野餐信息等。

  不同的通信有不同的侧重点。例如,在两个月内的公司野餐的信息与将在五分钟内关闭系统的消息的敏感度是不一样的。为了满足这些不同的需求,Linux 提供了不同的通信方式。下面的列表描述和对比了常用的方法。这些方法通常会提供给所有用户,除了当天消息通常只为具有 root 权限的用户保留外。

  有如下工具(实用程序)可以增强系统管理员与系统用户的通信和沟通。

  Write:使用 write 实用程序可以与在本地系统上登录的用户进行通信。例如,可以使用它来要求用户停止运行拖慢系统的程序,该用户可能会回复说:他将在三分钟内完成。用户还可以使用 write 来要求系统管理员挂载磁带或恢复文件。write 发送的消息可能不会出现在图形环境中。

  IM:Empathy IM(Internet 消息 ; live.gnome.org/Empathy)实用程序使用 Google Talk、MSN、IRC、AIM、Facebook、雅虎、ICQ 以及其它协议,支持文本、语音、视频聊天和文件传输。使用时,可点击主菜单:Applications?Internet?Empathy Internet Messaging.IM 常见于许多工作场所,可以用它来联系 Red Hat 支持。

  Wall:wall(write all)实用程序可以有效地与所有登录用户即时通信。此实用程序从标准输入获得输入,工作方式很像 write,只不过用户不能使用 wall 来只写回你一个人。当要关闭系统或在其它危机情况下,可使用 wall.没有登录的用户将无法得到消息。只有在危机情况下才可以使用 root 权限的用户身份运行 wall; 它会中断任何人在做的任何工作。wall 发送的消息可能不会出现在图形环境中。

  Email:电子邮件用于与一个或多个系统和 / 或远程用户进行不太紧急的通信。发送邮件后,你必须愿意等待每个用户来阅读它。电子邮件可用于提醒忘了注销的用户,他们的帐单已逾期,或他们使用了太多的磁盘空间。与通过 write 收到的消息相反,用户可以轻松地存储通过电子邮件接收的消息记录,因此他们可以随时跟踪重要的细节。举例来说,使用电子邮件告知用户一个新的复杂操作过程,以便每个用户都可以保留一份信息副本,以供参考。

  当日消息:用户每次在文本环境中登录时会看到当日消息,而当他们打开终端仿真器窗口时则不会看到。必要时,可以编辑 /etc/motd 文件以更改此消息。当日消息可以提醒用户将要进行的定期保养、新的系统功能或程序的更新信息。

  Need to Know II:运维过程中可能产生的问题

  即使是经验丰富的系统管理员也会犯错误,当然新的系统管理员犯的错误会更多。虽然可以通过细心阅读以及遵循软件文档的指示来降低出问题的可能性,但很多事情仍然会出问题。一个列表不管多长,都不可能是全面的,因为每天都会产生新的问题。本节将介绍一些常见技能,以避免问题的出现。

  第一,执行定期备份:对一个系统管理员来说,没有什么比永远丢失重要信息更痛苦。如果本地系统支持多用户,有近的备份可能是防止公共谴责的保障。如果是单用户系统,当丢失一块硬盘或误删文件时,有近的备份也肯定使你快乐。

  第二,阅读和遵循指示 :软件开发人员提供了文档。即使已经安装了软件包,也要再次仔细阅读说明书。它们可能已有所改变,或者你可能记得不对。软件更改比书的修订更快速,因此没有任何说明书可以做到万无一失。所以,需要寻找新的在线文档进行参考。/usr/share/doc 目录中有许多实用程序、库和软件包的相关信息。

  当指示不明确时,需要寻求帮助:如果指示似乎不明确,尝试找到明确的指示。

  后,在关键文件中删除或误输信息:一个肯定会给自己带来恶梦的方式是执行命令。也许没有其它命令会使 Linux 系统无用的如此之快。的办法是从安装介质启动以恢复已安装的系统,并从近的备份中恢复丢失的文件。虽然这个例子描述的是一个极端的情况,许多文件都是系统正常运作的关键。删除这些文件之一或在其中的文件中误输信息,都几乎可以肯定会造成问题。例如如果直接编辑 /etc/passwd 文件,在某个字段中输入错误信息会导致一个或多个用户无法登录。此外,不要在 rm – rf 中使用包含通配符的参数,输入命令后要暂停一下并阅读它,然后才按回车键。仔细检查所做的一切,在对关键文件进行编辑之前一定要为其制作一份副本。尤其值得注意:rm 与通配符一起使用时要小心。当必须在 rm 命令中使用包含通配符的参数(如 *)时,指定 i 选项以使 rm 在删除每个文件之前进行提示。或者,可以以相同的参数使用 echo 命令,以查看哪些文件将被删除。当使用 root 权,这种检查显得尤为重要。