2005-10-03

UNIX演义

UNIX演义(一)

"One half of the world must sweat and goarn that the other half may dream."
----Henry Wadworth Longfellow

UNIX的历史展现了许多关于UNIX哲学的内容。从她为什么流行至今,到她为什么有如此古怪的许可证制度,我们沿着UNIX走向成熟的道路讲述这段历史,研究UNIX 哲学及其演变过程。

1.1 创世之初
我们先谈谈UNIX的创世之初,有两点需要牢牢把握:
1) 虽然UNIX的许多部分和其实现过程是创造性的,但其几个重要的思想都可以追溯到早期的操作系统发展,并且
2) 如果不是Ken Thompson,如果不是他心灵手巧,擅长摆弄当时那些身边触手可及的工具,UNIX是不可能被写出来的。

那是1968年,Ken Thompson和同在贝尔实验室计算机研究小组的同事们一起进行关于MULTICS项目的研究工作。MULTICS是一个误入歧途而又辉煌灿烂的计算系统。她提供了非常复杂的功能,同时消耗大量的计算资源。她太大而且太慢,研究人员们不得不一开始就缩减其初始设,进行简化实现。
尽管如此,几个可工作的MULTICS实现还是完成了,提供了非常好的计算环境。在贝尔实验室的那个是在一台模拟GE635的GE645上完成的。系统提供分时服务,但她主要是面向批处理的,其环境笨拙
且不友好。Ken和他的伙伴们(特别是Dennis Ritchie和Joseph Ossanna)不想放弃MULTICS提供的舒适环境,于是他们开始向AT&T的管理部门游说,希望能获得一个交互式平台,诸如DEC-10,并在其上建造他们自己的操作系统。

DEC-10是DEC公司(Digtal Equipment Corp.)推出的一系列机种的一种。该机有一个非常灵活的交互式分时系统。很不幸,与那个时代的许多分时平台一样,DEC-10非常昂贵。我们应该庆幸,Ken的请求被拒绝了。这样的情形又发生了几次,这对Ken来说是太不幸了。由于MULTICS的失败,AT&T管理当局被Ken的计划打动,他们也没有兴趣来投资另一个仅仅是在不同的硬件上设计一个看起来与MULTICS一样的操作系统。与此同时,Ken对一个成为星际旅行的游戏非常有兴趣。该程序模拟太阳系的几个主要的星体和一艘可在不同对方着陆的飞船。Ken将其安装在GE系统上,GE系统忽快忽慢的响应时间让Ken大为失望。而且根据后来Dennis的说法,在GE系统上运行一次该游戏需要75美元,太贵了。Ken和Dennis后来找到了现在非常有名的"little-used PDP-7 sitting in a corner",他们用GE系统生成了可在该机器运行的程序代码。

UNIX演义(二)

1.2 创世
有了星际旅行,Ken有了正当的理由去实现他曾在MULTICS计划中设计和模拟的理论上的文件系统。很自然,一台有用的机器需要的不仅仅是一个文件系统。Ken和他的朋友还完成了第一个命令解释器(或Shell)和一些简单的文件处理工具。开始时,他们用GE系统来为PDP-7进行交叉编译。很快,他们写好了汇编器(assembler),系统已经开始自支持了。
这时的系统已经有了象UNIX了(如用fork()来支持多任务)。文件系统与现在的文件系统相对相似。它使用i-节点,而且有特殊的文件类型来支持目录和设备。那台PDP-7可同时支持二个用户。
MULTICS其实是代表"MULTiplexed Information and Computing System"。1970年,Brian Kernighan开玩笑称Ken的系统为"UNICS",代表"UNiplexed Information and Computinig System",毕竟与Ken的系统相比,MULTICS过于庞大了。(某些人称MULTICS代表"Many Unnecessarily Large Tables In Core Simultaneously" 而UNIX则是裁剪了的MULTICS。:)不久,UNICS变成了UNIX而且被流传下来。

计算机研究小组并不对PDP-7十分满意。其一是它是借来的一台机器,更主要的是它能力有限,不太可能提供计算服务。于是小组再次提交申请,这回是一台PDP-11/20来研究文字处理。该申请与前一次的显著的区别是PDP-10的价格只是DEC-10的凤毛麟角。由于这次的申请十分具体,一个文字处理系统,AT&T的管理当局宽宏大量为他们购买了PDP-11。
1970年UNIX被移植到PDP-11/20上。那可不是一件轻而易举的事,整个系统全是用汇编写的啊!小组又将汇编写的roff(又称为runoff,troff的前身)从PDP-7移植到PDP-11上。再加上一个编辑器就足以称为一个文字处理系统了。

与此同时,贝尔实验室的专利局正在寻找一个文字处理系统。他们选择了计算机研究小组的基于UNIX系统的PDP-11/20。贝尔实验室专利局成了UNIX的首家商业用户。
这第一个系统有几点是很值得注意的。跑UNIX的PDP-11/20没有存储保护。它仅有一个0.5Mb的磁盘。它支持同时三个用户,分别完成编辑,排版,再加上计算机研究小组进行进一步的UNIX开发。该系统的手册被标为"First Edition",日期为1971年11月。
现在都习惯在手册的版本后注明发行号。这样可能更清楚些,editions也可称为versions,他们是一个意思。例如,Version 7和7th Edition是一回事。

第二版于1972年发行,增添了管道的功能。该版本还加上了除汇编之外的编程语言支持。特别值得一提的是Ken曾试图用NB语言来重写核心。
NB是由B语言(由Ken和Dennis设计)修改而来的。B语言的前身是BCPL,BCPL(Basic CPL)是Martin Richards于1967年在剑桥设计的。CPL(Combined Programming Language)则是1963年伦敦大学和剑桥大学的合作项目。而CPL则颇受Algol60(1960 设计)的设计思想影响。
所有这些语言在控制结构上都和C语言相似,不过B和BCPL都是"无类型"的语言(尽管有点用词不当),它们只支持按"字"来访问内存。NB演化为C,而C则很快称为新的工具和应用的首选语言。
参与MULTICS(MULTICS用PL/I书写)的经验告诉Ken和Dennis,用高级语言来写系统是合算的。由此,他们一直试图完成它。1973年,C语言加入了结构和全局变量。与此同时,Ken和Dennis成功地用C重写了UNIX核心。Shell也被重写了。这增加系统的鲁棒性,也使编程和调试变得容易了很多。
那时,大约有25个UNIX系统。在贝尔实验室内部成立了UNIX系统小组来进行内部维护工作。几家大学都和贝尔实验室签定协议,获得了第四版的拷贝。协议主要是不泄露源码,在那时还没有许可证这回事。Ken自己录制磁带,不收任何费用。第一卷磁带由在纽约的哥伦比亚大学获得。
1974年,Ken和Dennis在Communications of the ACM上发表了论文介绍UNIX系统。那时,Communications是计算机科学的主要刊物,那篇文章在学术界引起了广泛的兴趣。第五版正式以"仅用于教育目的"的方式向各大学提供。价格也只是名义上够磁带和手册的费用。第五版在许多大学用作教学。

这时Ken和Dennis仍在积极地投入UNIX的研究;然而,他们继续避免提供支持的承诺。他们的小组被称为"Research"(或在贝尔实验室内部称为"1127")。他们的机器被命名为research。你可以通过uucp向他们发送bug报告,打电话询问他们,甚至进他们的办公室和他们一起讨论UNIX的问题。通常他们总能在其后的若干天内解决bug。
与research的在贝尔实验室的另一个小组被称为PWB,Programmer's Workbench。由Rudd Canaday领导的PWB小组支持一个用于大型软件开发的UNIX版本。PWB试图向那些并不对UNIX研究感兴趣的用户通过服务。他们做了大量的工作来强化了UNIX的核心,包括支持更多的用户。PWB的两个非常有用的计划分别是SCCS(源码控制系统)和RJE(使用UNIX作为实验室其它主机的前段)。PWB最终注册为PWB/UNIX1.0。

UNIX替代了越来越多的PDP-11上的DEC公司的操作系统。尽管UNIX不被支持,但她的魅力远胜于她的问题而吸引了许多的用户。除了系统本身的许多优点外,源码是可以获得的,而且系统从整体上也是易于理解的。进行修改和扩充很容易。这使得UNIX与其同类的其它操作系统大不一样。
1975年,第六版UNIX系统发行了。这是第一个在贝尔实验室外广为流传的UNIX系统。AT&T(通过West Electric Co.)开始向商业和政府用户提供许可证。Mike Lesk发行了他的可移植C语言库。该库提供了可在任何支持C语言的机器上进行I/O的库例程。这是用C书写可移植代码的重要的一步。Dennis后来重写了该库并称其为标准I/O库(即所谓stdio)。

UNIX用户们首次在纽约市进行会晤,有纽约城市大学的Mel Ferentz作东。当时有40人参加。从此以后该会议每两年举行一次,会议是极不正式的。如果你想进行演讲,你就举手,并且讲就行了。这些会议是极好的交流bugs报告,修改和软件的方式。每个人都带上两卷磁带参加会议,一卷是给别人的,一卷是用来录制新东西的。

Ferentz创办了一个称为UNIX News的实事通讯(newsletter)的服务,免费为用户发送消息。后来冒出一个来自贝尔的家伙告知他不能使用UNIX的名字,于是他把它改名为;login。随着越来越多的人想要实事通讯的服务,Ferentz不堪免费提供这些服务了。于是创立一个组织来处理这些费用,它被称为USENIX。USENIX很快负起了其它的义务,包括组织会议和软件的分布。

远在澳大利亚的新南威尔士大学,John Lions正在为操作系统课程准备教程。课程的目的是UNIX实例研究,课程的笔记被出版为"A Commentary on the UNIX Operating System"。笔记中包括了加上了Lion's注释的整个V6 UNIX核心。基本上每一行都被解释了(包括那些被注明"无需理解(not expected to understand)的代码行")。
由于引用了大量的源码,该书的出版许可最终被撤回了。但因其已经销售,UNIX因此比以往更易于获得。
1977年,Interactive Systems公司称为首家向最终用户出售UNIX的公司。UNIX终于成了产品。
在同一时期有三个小组将UNIX移植到不同的机器上。Steve Johnson和Dennis Ritchie将UNIX移植到一台Interdata 8/32机器上。澳大利亚的Wollongong大学的Richard Miller和同事们将UNIX移植到一台Interdata 7/31上。Tom Lyon和其在普林斯顿(Princeton)的助手们完成了到VM/370的移植。

每次移植都干的十分漂亮。具体点,所有这三台机器都与PDP-11有显著的差异。事实上,这正是问题之所在。许多操作系统都没有被设计为能在多种机器上跑。类似地,许多机器又为了某种特定的操作系统而设计。例如,如果硬件能完成进程之间的保护,操作系统利用这功能就很有意义了。
随着厂家提供带有附加选项的硬件,操作系统被写成理解这些硬件的。它们为了利用这些特殊的硬件大多是用汇编来写的。
Dennis和Ken的最大的突破在于他们清楚的认识到在效率和效用之间存在着折衷。如果你能避免白手起家而完成移植的工作而且并不牺牲太多的性能,那么这是值得的。作这样的决定并不困难,远在他们用C重写UNIX核心时他们已成功地使用类似的思想。如果用汇编写,UNIX可能会更快和更小,但系统变得如此的易于修改,理解和移植,牺牲速度和内存是值得的。

UNIX很快被移植到其它类型的PDP-11上。每个都有些很有趣的功能且不断地加大了UNIX
可支持硬件的复杂度(这些功能包括浮点处理器,可写微码,内存管理和保护,分离的指令和数据空间等等)。
然而,PDP-11系列很明显地都是基于16位地址空间的,所有的程序都实现于64Kb的大小。很滑稽的是这到促进了小程序的编写。有了支持合作进程的管道以及exec()之后,通过它们将几个小的应用连接一个大的应用。这是UNIX编程的一个特点,也许我们要感谢PDP-11有限的地址空间。
UNIX被移植到IBM的Series1小型机上(尽管有人认为这好比是将物质与反物质结合在一起)。Series1有与PDP-11相同的字大小,但它的字节是颠倒的。因此当系统初次启动时它打印出来的是"NUXI"而不是"UNIX"。从那时起,"NUXI"问题就成了字节顺序问题的代名词。
1977年,加利福尼亚伯克利分校(the University of California, Berkeley)的计算机科学系开始发行他们的Pascal解释器。其中还包括了一些新的设备驱动程序,对核心的修改,ex编辑器,和一个比V6的Shell更好用的Shell("Pascal Shell")。这就是所谓的1BSD(1st Berkeley Software Distribution)。

UNIX演义(三)

1.3 思想
今天与UNIX相关的特点从那之后就大部分全有了。我们已谈过了她的可移植性。其它的值得吹吹的特点有:1)一致的文件,设备和进程间I/O,2)启动异步进程的能力,3)用其它Shell来替代默认Shell的能力,和4)层次化的文件系统。

还有些特点一样使UNIX流行,下述特点被普遍认为是绝对不容争辩的。使人惊讶的是,70年代的许多系统并不是没有这些特点,但80年代的许多系统却抛弃了这些特点(诸如IBM的CMS系统的flat文件系统)。

值得一提的特点是:
1) 命令和库的一致性。这使得堆积木的方法变得非常容易。因为程序员必须假设自己的程序的输出是其它程序的输入,他们不能输出太多的空话,诸如其它系统工具中输出的"麻点"。UNIX中大多数程序使用标准的输入和输出。
库和系统调用都似乎都提供一种做事的方法,即用最简单的方法去解决大多数问题。这种方法一直在核心的构造中持续,UNIX的核心小得一个程序员就可以理解整个核心。
2) 主要的文件类型是文本。例如,/etc/passwd可以用一般的文本编辑器来编辑。在大部分其它的系统上你不得不用一个特殊的工具来读写这些文件。而在UNIX中,你有了编辑器你就可以控制每一样东西。
3) Shell可用来编程,它有着丰富的控制结构和参数传递机制。许多人不须为学C语言而费心,因为Shell和已有的程序可以很容易的组合起来完成相同的功能。有趣的是Shell的控制结构(如goto,test)其实都是用独立的程序来实现的。

第六版的手册还不到300页,而且装成一卷正合适。sh的说明有三页长。
到1978底已有600多个UNIX安装。大部分是大学和政府机关。

没有评论:

发表评论