在去年的YOW Melbourne开发者大会上,我参加了一些研习班。这些研习班由@coreyhaines和 @rains负责,因此TDD(测试驱动开发)成为了主要讨论的内容。通常这不是一个问题,但是令人沮丧的是(考虑到这是2010年举办的开发者大会),那时上网还不是很方便,我刚装上linux的笔记本无法下载Rspec。幸运的是几周前,我决定自己写一个单元测试框架(因为我有这个能力:)),接着我就有了一个可用的测试框架,问题解决了。但是,这让我想到一个问题,最少可以用多少代码写成一个可用的单元测试框架?
一个最小可用的单元测试
刚开始写一个单元测试框架的时候代码是很少的,但当我想给它加入一些特性时就变得没有那么精炼了:) 幸运的是重写是很容易的。我们真正需要做的是执行下面的代码:
1
2
3
4
5
6
7
8
9
10
11
12
13
|
describe "some test" do it "should be true" do true .should == true end it "should show that an expression can be true" do ( 5 == 5 ).should == true end it "should be failing deliberately" do 5 .should == 6 end end |
正如你看到的,它很像是一个基本的Rspec测试。让我们写一些代码来执行它。
译注:RSpec 工具是一个 Ruby 软件包,可以用它构建有关您的软件的规范。该规范实际上是一个描述系统行为的测试。
构建一个简单的框架
首先要做的是使用“describe”来定义一个新的测试。既然我们想要把”describe” block放在任何地方(例如,文件本身),我们需要对Ruby做一点扩展。“puts”函数在Kernel block中,因此可以在任何地方使用(因为Object类包含了Kernel并且Ruby中的每个对象都继承自Object类),同样的我们会把describe放到Kernel block中以赋予同样的能力):
1
2
3
4
5
6
|
module Kernel def describe(description, &block) tests = Dsl. new .parse(description, block) tests.execute end end |
译注:Ruby block:Ruby语言的block功能类似回调函数。
正如你看到的,”describe”接收一个用来描述测试的字符串和包含了测试代码的block。在这里,我们将测试的代码和”describe”分开讲解(例如,”it” block)。因此我们创建了Dsl类,用它的parse函数处理待测试的block,结果会产生一个可以执行我们所有测试的对象,但是不要高兴得太早。Dsl类看上去是这样的:
1
2
3
4
5
6
7
8
9
10
11
12
|
class Dsl def initialize @tests = {} end def parse(description, block) self .instance_eval(&block) Executor. new (description, @tests ) end def it(description, &block) @tests [description] = block end end |
这里要做的是在Dsl对象的上下文里对block求值:
1
|
self .instance_eval(&block) |
我们的Dsl对象有一个”it”函数,同样也接收一个描述和一个block,这里和describe block包含的内容完全一致,一切都运行得很好(例如,我们基本上会在几个函数调用时使用”it”函数,每次都传入一个描述和一个block)。我们还可以在Dsl对象中定义其他的函数,并且这些函数会成为允许在”describe” block中使用的“语言”的一部分)。
在describe block中,”it”函数会为每个”it” block调用一次。每次调用时,会把输入的block以测试描述作为键值存储在哈希表中。完成这些以后,我们只要创建一个Executor对象,可以对我们所有的测试block进行迭代,调用它们并产生执行结果。Executor代码如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
|
class Executor def initialize(description, tests) @description = description @tests = tests @success_count = 0 @failure_count = 0 end def execute puts "#{@description}" @tests .each_pair do |name, block| print " - #{name}" result = self .instance_eval(&block) result ? @success_count += 1 : @failure_count += 1 puts result ? " SUCCESS" : " FAILURE" end summary end def summary puts "\n#{@tests.keys.size} tests, #{@success_count} success, #{@failure_count} failure" end end |
我们的executor代码非常简单。输出”describe” block的描述,然后遍历所有存储的”it” block并且在executor对象中执行它们。这么处理没有什么特别原因,但这意味着executor对象同样也可以包含其他函数,并且可以在”it” block中作为一种“语言”来使用(比如,我们dsl的一部分可以定义为executor的一个函数)。譬如,我们可以在executor上定义下列函数:
1
2
3
|
def should_be_five(x) 5 == x end |
这个函数同样可以在”it” block内部使用,但对于我们这个简单的测试没有这个必要。
所以,”it” block会计算并存储结果,通常结果只是”it” block最后一个语句的返回值(按照常规的Ruby)。这里,我们希望确保最后一个语句总是返回一个布尔值(标明测试通过或失败),通过它我们可以输出一些有意义提示。
我们还差最后一步,”should”函数代码如下:
1
2
|
true .should == true 5 .should == 5 |
每个对象都应当提供自己”should”函数,代码如下:
1
2
3
4
5
|
class Object def should self end end |
这个函数并没有真正做什么工作(仅仅是返回对象本身);它仅仅是一个让测试读起来更好的语法。
在这个阶段,我们只是将测试计算的结构转换成一个字符串,表明测试结果通过或失败并输出。在这个过程中,我们会统计通过或失败的测试数量,所以可以在最后给出一个总结报告。这就是我们所需要的所有的代码,如果我们将他们放到一起,就是下面的44行代码:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
|
module Kernel def describe(description, &block) tests = Dsl. new .parse(description, block) tests.execute end end class Object def should self end end class Dsl def initialize @tests = {} end def parse(description, block) self .instance_eval(&block) Executor. new (description, @tests ) end def it(description, &block) @tests [description] = block end end class Executor def initialize(description, tests) @description = description @tests = tests @success_count = 0 @failure_count = 0 end def execute puts "#{@description}" @tests .each_pair do |name, block| print " - #{name}" result = self .instance_eval(&block) result ? @success_count += 1 : @failure_count += 1 puts result ? " SUCCESS" : " FAILURE" end summary end def summary puts "\n#{@tests.keys.size} tests, #{@success_count} success, #{@failure_count} failure" end end |
如果我们“需要”使用这个框架执行最初的那个测试,我们会得到下面输出结果:
some test
- should be true SUCCESS
- should show that an expression can be true SUCCESS
- should be failing deliberately FAILURE
3 tests, 2 success, 1 failure
太好了!现在,如果你因没有一个单元测试框架而烦恼并且不想莽撞地写代码,只要花上5分钟你就可以得到一个能够助你一臂之力的测试框架。当然,这里有一些略微夸大;你很快就会想到这里缺少额外的验证API、更好的输出、对象仿真和测试桩等等。然而,我们可以很容易的在精简的框架上扩展其中的一些功能(例如,增加额外的DSL元素)——只消花费很小的努力。如果你不相信我,可以看看bacon ,它只用了几百行代码就完成了Rspec一个精简版。我编写的Attest测试框架是另一个很好的例子(这么说有自卖自夸的嫌疑:P)。这两者都缺少任何内建的test double 支持,我会在另外一个时间讨论如何添加test double支持。
译注:Test Double:在对象编程中“自动化单元测试”的专业术语,涵盖的类型有Test Stub(测试桩)、Mock Object、Test Spy、Fake Object和Dummy Object。