1.1 创造的根源
软件开发越来越需要创造力。创造的根源在于想象。如何运用想象能力以及提升想象技能,是软件开发成功与否的关键。
什么是创造?最简单的说法就是,经过人的智慧的加工,通过非必然的过程,产生非必然的结果。创造不能复制,每一次都是独特的。
钱学森先生认为,人的思维有三种类型:逻辑思维、形象思维和灵感思维。
逻辑思维是线形的,借助于数学和逻辑学中的公理,可以根据一些信息推导出精确的、必然的结果。
形象思维是面形的,在解决一个具体问题时,由于现象提供的信息非常复杂,无法完全使用逻辑推理的方式产生结果。在这种情况下,非科学性的知识和以往的经验,甚至人体中未被认识的特殊功能都可能帮助我们解决问题。
灵感思维是三维的,人类可以在潜意识中完成一些看似无法解决的问题。潜意识的研究目前还处于非常肤浅的阶段。我们谈论的创造是发生在人类可以控制的显意识方面的,主要是指形象思维。
我们说,软件开发越来越需要创造力,越来越需要形象思维。这种说法是有道理的,它体现在软件开发领域的方方面面。例如,编程语言的发展,就可以作为这个断语的证明。
众所周知,编程语言经过多年的发展,已经从面向机器的低级语言“进化为”面向领域和对象的高级语言。越是高级的语言,抽象程度就越高,人类想象力和创造精神的特征也越明显。
15年前,我刚刚进入工业控制行业,从事嵌入式设备(单片机)的软件开发。这段经历使我有机会从硬件的角度来认识软件的本质。10年前,我开始从事企业级信息系统的开发,在应用软件的构建方面积累了一定的经验。这段经历又使我有机会从领域的角度来认识软件。
为了论证上面提到的关于创造的观点,我想结合自己的经历,谈谈对单片机、编程语言和企业信息系统的认识。这些认识看上去非常基础,涉及的内容听上去有点枯燥,但它们却是想象的基础。
我有一个有趣的想法:如果人们愿意定心敛神,细细体会熟视无睹的事物,一定可以得到超出想象的收获。
在谈单片机之前,必须先提到两个基本的概念:二进制和与或非逻辑。
二进制是计算技术中广泛采用的一种数制。这种数制,只包含0和1两个数,基数是2,进位时逢二进一,借位时借一当二。
与或非逻辑是布尔代数中的基本运算逻辑。在布尔代数中,同样只有两个逻辑值,逻辑1和逻辑0,代表两种相反的逻辑状态。逻辑“与”相当于生活中说的“并且”,在两个条件都同时成立的情况下,逻辑“与”的运算结果是“真”;逻辑“或”相当于生活中说的“或者”,只要两个条件中有任意一个条件满足,逻辑“或”的运算结果是“真”;逻辑“非”表示与本来的情况相反的情况。
与或非逻辑代表了人类的一种思维规律,同时与二进制吻合得天衣无缝。我们来看看二进制运算中的与或非逻辑。
二进制加法有四种情况
- 0+0=0(逻辑或)
- 0+1=1(逻辑或)
- 1+0=1(逻辑或)
- 1+1=0(进位为1)(逻辑或,然后是一次有趣的移位)
二进制乘法有四种情况
- 0*0=0(逻辑与)
- 0*1=0(逻辑与)
- 1*0=0(逻辑与)
- 1*1=1(逻辑与)
关于二进制和与或非逻辑的更多知识,大家可以查阅相关的参考书。
我想强调的是,二进制和与或非逻辑这两个概念可以很容易地通过硬件来实现。例如,5V电位(通的状态)代表1,0V电位(断的状态)代表0。逻辑“与”则涉及两个输入电位和一个输出电位,当两个输入电位分别为5V和0V时,输出电位为0V。场效应管CMOS或者双极晶体管TTL这些具有开关特性的电子元件都可以实现这种逻辑要求。
简单来说,电子计算机就是可以进行二进制计算的机器。它可以帮助人类节省逻辑思维的时间和精力,目前它能帮助人类的也仅此而已。
单片机中包含了大量具有开关特性的电子元件。作为一种微型计算机,它几乎具有普通计算机的所有特征。大规模的集成电路给了二进制和与或非逻辑表演的平台;CPU处理自己可以识别的指令,并帮助人类进行逻辑计算;IO系统处理各种数据和地址信息;晶振可以保证电子元件间的同步与协作;中断系统则像一位计算任务的调度员。存储器通常是一个必需的外部系统,存储的内容包括指令(程序)和数据。地址总线和数据总线为CPU建立了与外部系统联系的通道。
单片机的基本组成看上去并不复杂,我们来看看它的工作原理。
首先,单片机需要加电。电子元件的各种特性要依赖于特定的电压和电流。单片机加电后,电子元件有电流通过,晶振开始工作。于是所有的元件有了时间规则,有了合作完成一项任务的基础。中断系统处在待命状态,等待任何一项任务的触发条件。CPU借助于地址总线和数据总线,从存有指令的存储器中获取指令(程序),这些指令全部是二进制的。它们不是任意的,而是CPU指定的二进制格式。指令(程序)中可能涉及一些位于特定存储地址中的数据,CPU还要负责从那些地址中取数。CPU按照指令的要求进行计算(利用电子元件的开关特性),计算的结果可能会存放到指定的存储地址中;也可能暂时存储在和CPU关系更紧密的内部空间(存取速度比外部空间更快),例如累加器或其他寄存器;计算结果(一系列的开关信号)更有可能通过数据总线输出到指定的IO。IO是计算机连接现实世界的桥梁。
我曾经开发过铁路道岔预警系统,那些指定的IO被连接到一些微型开关。这些微型开关控制着一些LED光带,从而可以展示整个道岔系统的状态。
谈到这里,我们终于可以引出软件的概念。什么是软件?本质上就是那些特定于CPU的二进制指令的集合。在我所使用的单片机中,二进制指令是8位的。根据CPU的不同,指令也可能是16位、32位或64位。这些指令,从操作人员的角度看,就是一些语言;从机器的角度看,就是一组开关信号。老实说,当你用示波器去看那些指令、地址或数据时,一定会在软硬件的交界点上感慨万千。
好,我们谈到了语言。当这些语言经过组织、编排,从而让机器自动化工作时,我们又有了程序的概念。
15年前,我使用汇编语言来编写单片机程序。汇编语言与机器语言(完全由0和1组成,可以把机器语言看成是特定于CPU的开关信号)是完全对应的。两者之间的些微区别在于,汇编语言提供了一些人类可以理解的助记符,例如,数据传送符、跳转符、条件符、中断符等。关于汇编语言的细节,可以参考相关的书籍。
在使用汇编语言的时候,需要了解数据存储的地址、数据传送的目的地、二进制数运算的方法以及各种寄存器的特殊用法。
在汇编语言中,数据结构的概念是很淡的,更不要说围绕数据结构展开的算法了。数据结构和算法的繁荣发生在比汇编语言高一级的编程语言中,例如C语言。
出现一种更高级的语言是人类抽象的需要。抽象,是因为发现了逻辑推理中的规律。这些规律具有可以重复使用的特征,但是,规律本身重现起来比较复杂。
例如,用汇编语言来实现一个四则运算就有点复杂。在汇编语言中,既没有足够丰富的对人友好的操作符,而且在处理数学计算时会涉及不少硬件概念。你看,因为CPU的不同(机器语言不同)、硬件调度上下文(使用不同的寄存器)的差异,四则运算的实现也不会完全一样。而C语言(也包括很多其他的高一级语言,BASIC、Fortran)的出现,满足了人类在进行数学计算过程中的抽象要求。
为了实现数学计算的抽象,这些高级语言的背后,还有很多相关的技术在支撑着,例如,C语言编译器、链接器、运行库、操作系统加载器等。C语言编写的程序和其他语言编写的程序,在运用计算机这个硬件资源上没有什么区别;那些隐藏在幕后的技术,使我们可以仅仅关注于抽象的程序,而几乎不考虑硬件的问题。
C语言在一定程度上解决了人类在数学计算和逻辑推理上的抽象。从此,软件的主要关注点转移到数据结构(线性表、栈、队列、串、数组、二叉树、图等)和各种算法(对特定问题的求解过程)上,经过多年的发展,数据结构和算法已经成了计算机专业的一门基础课程,而几乎所有的教科书,都是用规范的数学语言来描述数据结构的。
算法就是数学问题的求解过程。在使用C语言来实现一个软件系统时,逻辑思维占了绝对的比重。
10年前,我又开始从事企业级信息系统的开发。工作中接触最多的是Java语言。从语言的抽象程度来说,Java语言与C语言没有太大的区别。Java语言同样可以解决C语言能处理的一切问题(可以描述相同的数据结构,并给出相同的算法)。一个微妙的不同之处在于,Java语言对于数据结构中的数据类型进行了新的抽象,引入了类和对象的概念。因为这个概念的引入,一次新的面向对象的革命产生了。
当代的企业级信息系统与Java语言结合得非常完美,这不是偶然的。我们知道,企业级信息系统需要解决的是领域问题,而不单单是数学运算问题。
领域问题最终会转化为一个个数学运算,但是在求解领域问题的过程中,仅仅依靠数学知识是远远不够的。
例如,保险公司的承保业务,不仅需要大量的信息数据,还需要复杂的业务逻辑。要描述这些业务逻辑,必须站在领域的高度上进行。此外,复杂多变的用户需求、数不胜数的方案模型、参差不齐的开发团队、成年累月的项目周期,这些各方面的因素都会对信息系统的开发产生影响。
处理领域问题就像战场上的一个个战役,指挥官决策(问题求解)时,可以参考和依据的现象太复杂了,他必须借助面形的思维(经验、习惯以及形象思维)才能指挥队伍朝正确的方向前进。
Java语言恰好是进行面形思维的一个好工具。
为什么这么说呢?因为Java语言引入了类和对象的概念。这使得这种语言的使用者从单纯的逻辑思维中跳了出来。人们开始发现,编程语言与领域世界是如此贴近,以至于人类的想象几乎可以完整地从软件系统中再现出来,换句话说,人们可以使用Java语言进行隐喻式编程了。关于隐喻式编程的详细内容,我会在第4章的某一节展开讨论。
Java语言培养了我在软件开发中的想象能力,这是其他任何一种编程语言都没有给过我的。
多年前,我曾经阅读了Tomcat(一个开源的servlet引擎,用Java语言实现,它也提供Web服务)的源码。我看到一个HTTP的请求被Tomcat监听到以后,它根据请求数据中携带的特征,开启了不同的阀门。开启的阀门引导数据流进入相应的管道。管道中有各种解释器对数据进行分析。分析后再转发给相应的处理器。简直不可思议,我就像阅读一个故事,第一次从软件中体验到了一个想象的世界!
这次阅读使我开始反思自己的软件开发生涯。反思的结果是:
- 多年来一直在编写程序,而且翻阅了不少软件产品或技术的操作手册;
- 已经比较善于理解各种需求了,而且可以直接地给予实现;
- 可以从软件的运行中得到乐趣了,可是还没有开始关注软件本身;
- 学到了一些知识,但是这些知识总显得杂乱零散;
- 我的软件开发工作几乎没有任何创造性。
反思中的最后一条使我很震惊,我也因此领悟了一些道理。总结起来只有一句话:软件的美和价值在于创造,创造的根源在于想象。
此后,我按照自己领悟的道理来评价我所接触到的一切事物。我不再觉得迷惘、犹豫,一切仿佛都变得简单了。我开始追求一个富有创造力的想象世界。
当然,想象世界并不依附于编程语言而存在,但是,一种合适的编程语言可以使我们更容易地表达想象。基于这个原因,我认为Java语言是C语言的一个发展。当然,如果你有一个足够抽象的库,如果你不考虑内存分配和释放,如果你不使用寄存器,如果你不使用地址概念和指针,C语言也能和Java一样,让人驰骋在一个更高级抽象的想象世界。
我开始觉得有趣了。编程语言的发展,扩展了我们想象的空间,也帮助我们养成了一些想象的习惯。你看,我们可以把Web服务想象成一个政府的办公流程,甚至可以是一次朋友的聚会。这些想象可以用来创造软件,而且为软件带来了异乎寻常的活力。换句话说,我们的人生阅历,可以用来帮助自己进行想象和创造,并把它们用软件的形式表达出来,这不是很有趣的一件事吗?
不过,在软件开发中,想象和创造是需要一定技能的。这不仅体现在编程上,还体现在软件开发中的方方面面,包括思考方法、项目管理、架构设计,等等。本书中有一些想象和创造的例子。
能够充分展开想象,是创造能力的集中体现。
事实上,在我所经历的一些糟糕的软件开发案例中,最大的问题,往往源于缺乏想象或想法混乱造成的软件架构问题,以及毫无想象力的、僵化的项目管理思想。只有较小的一些问题,来自具体的工作细节,例如,糟糕的算法和糟糕的逻辑思维。这也从另一个角度证明了想象和创造的价值。