ready-begin
各就各位,预备!
[$img/startingout.png]
好的,出发!如果你属于那种从不看说明书的不良人士,我推荐你还是回头看一下简介的最后一节。那里面讲了这个教程中你需要用到的工具及基本用法。我们首先要做的就是进入ghc的交互模式,接着就可以调几个函数小体验一把Haskell了。打开控制台,输入ghci,可以看到如下欢迎信息:
{{
GHCi, version 6.8.2: http://www.haskell.org/ghc/
:? for help Loading package base ... linking ... done.
Prelude>
}}
恭喜,你已经进入了ghci!目前它的命令行提示为prelude>
,不过在你装载什么东西之后,它会随着变得比较长。免得碍眼,我们输入个:set prompt "ghci> "
把它改成ghci>
。
如下是一些简单的运算:
{{
ghci> 2 + 15 17
ghci> 49 * 100 4900
ghci> 1892 - 1472 420
ghci> 5 / 2 2.5
ghci>
}}
很简单。也可以在一行中使用多个运算符,按照运算符优先级执行计算,使用括号可以更改优先级次序。
{{
ghci> (50 * 100) - 4999
1
ghci> 50 * 100 - 4999
1
ghci> 50 * (100 - 4999)
-244950
}}
很酷么?嗯,我承认不。处理负数时会有个小陷阱:执行5 * -3
会使ghci报错。因此,使用负数时最好将其置于括号之中,像5 * (-3)
就不会有问题。
逻辑运算也同样直白,你也许知道,&& 指逻辑与,|| 指逻辑或,not 指逻辑否。
{{
ghci> True && False
False
ghci> True && True
True
ghci> False || True
True
ghci> not False
True
ghci> not (True && True)
False
}}
相等性可以这样判定:
{{
ghci> 5 == 5
True
ghci> 1 == 0
False
ghci> 5 /= 5
False
ghci> 5 /= 4
True
ghci> "hello" == "hello"
True
}}
/=
表示不等于
执行5 + "llama"
或者5 == True
会怎样?好的,一个大大的报错等着你。
{{
No instance for (Num [Char])
arising from a use of `+' at :1:0-9
Possible fix: add an instance declaration for (Num [Char])
In the expression: 5 + "llama"
In the definition of `it': it = 5 + "llama"
}}
呀呀!ghci 提示说"llama"
并不是数值类型,所以它不知道该怎样才能给它加上5。即便是"four"
甚至是"4"
也不可以,Haskell不拿它当数值。执行True == 5
, ghci就会提示类型不匹配。+
运算符要求两端都是数值,而==
运算符仅对两个可比较的值可用。这就要求他们的类型都必须匹配,苹果和橙子就无法做比较。我们会在后面深入地理解类型的概念。
5 + 4.0
是可以执行的,5
既可以做被看做整数也可以被看做浮点数,但4.0
则不能被看做整数。
[$img/ringring.png]
也许你并未察觉,不过从始至终我们一直都在使用函数。*
就是一个将两个数相乘的函数,就像三明治一样,用两个参数将它夹在中央,这被称作中缀函数。而其他大多数不能与数夹在一起的函数则被称作前缀函数。绝大部分函数都是前缀函数,在后面我们就不多做甄别。大多数命令式编程语言中的函数调用形式通常就是函数名、括号、由逗号分隔的参数表。而在Haskell中,函数调用的形式是函数名、空格、空格分隔的参数表。简单举个例子,我们调用Haskell中最无聊的函数:
{{
ghci> succ 8
9
}}
succ
函数返回一个数的后继(译者注: successor, 在这里就是8后面那个数,也就是9)。如你所见,通过空格将函数与参数分隔。调用多个参数的函数也是同样容易,min
和max
接受两个可比较大小的参数,并返回较大或者较小的那个数。
{{
ghci> min 9 10
9
ghci> min 3.4 3.2
3.2
ghci> max 100 101
101
}}
函数调用拥有最高的优先级,如下两句是等效的:
{{
ghci> succ 9 + max 5 4 + 1
16
ghci> (succ 9) + (max 5 4) + 1
16
}}
若要取9乘10的后继,succ 9 * 10
是不行的,程序会先取9的后继,然后再乘以10得100。正确的写法应该是succ (9 * 10)
,得91。如果某函数有两个参数,也可以用 .. 符号将它括起,以中缀函数的形式调用它。例如求两个整数相除所得商的``div``函数,div 92 10可得9,但这种形式不容易理解:究竟是哪个数是除数,哪个数被除?使用中缀函数的形式`` 92
div` 10 就更清晰了。从命令式编程走过来的人们往往会觉得函数调用离不开括号,比如在C中调用函数必加括号,就像
foo(),
bar(1)或者
baz(3, "haha")这样。而在Haskell中,函数必须使用使用空格来,所以上述函数在Haskell中应该写作
foo,
bar 1和
baz 3 "haha"。所以
bar (bar 3)并不表示以
bar和
3两个参数去调用
bar,而是以
bar 3所得的结果作为参数去调用
bar。在C中,就相当于
bar(bar(3))``。
启蒙:你的第一个函数
在前一节中我们简单介绍了函数的调用,现在让我们编写我们自己的函数!打开你最喜欢的编辑器,输入如下代码,它的功能就是将一个数字乘以2.
{{
doubleMe x = x + x
}}
函数的声明与它的调用形式大体相同,都是先函数名,后跟由空格分隔的参数表。但在声明中一定要在 = 后面定义函数的行为。
保存为baby.hs或任意名称,然后转至保存的位置,打开ghci,执行:l baby.hs
。这样我们的函数就装载成功,可以调用了。
{{
ghci> :l baby
[1 of 1] Compiling Main ( baby.hs, interpreted )
Ok, modules loaded: Main.
ghci> doubleMe 9
18
ghci> doubleMe 8.3
16.6
}}
+ 运算符对整数和浮点都可用(实际上所有有数字特征的值都可以),所以我们的函数可以处理一切数值。声明一个包含两个参数的函数如下:
{{
doubleUs x y = x*2 + y*2
}}
很简单。将它写成doubleUs x y = x + x + y + y
也可以。测试一下(记住要保存为baby.hs并到ghci下边执行:l baby.hs
):
{{
ghci> doubleUs 4 9 26
ghci> doubleUs 2.3 34.2 73.0
ghci> doubleUs 28 88 + doubleMe 123
478
}}
你可以在其他函数中调用你编写的函数,如此一来我们可以将doubleMe
函数改为:
{{
doubleUs x y = doubleMe x + doubleMe y
}}
[^img/baby.png]
这种情形在Haskell下边十分常见:编写一些简单的函数,然后将它们组合起来,形成一个较为复杂的函数,这样可以减少重复工作。设想若是哪天有个数学家验证说2应该是3,我们只需要将doubleMe改为x+x+x
即可,由于doubleUs调用到doubleMe,于是整个程序便轻松进入2即是3的古怪世界。
Haskell中的函数并没有顺序,所以先声明doubleUs还是先声明doubleMe都是同样的。如下,我们编写一个函数,它将小于100的数都乘以2,因为大于100的数都已经足够大了!
{{
doubleSmallNumber x = if x > 100
then x
else x*2
}}
接下来介绍Haskell的if语句。你也许会觉得和其他语言很像,不过存在一些不同。Haskell中if语句的else部分是不可省略。在命令式语言中,你可以通过if语句来跳过一段代码,而在Haskell中,每个函数和表达式都要返回一个结果。对于这点我觉得将if语句置于一行之中会更易理解。Haskell 中的if语句的另一个特点就是它其实是个表达式,表达式就是返回一个值的一段代码:5是个表达式,它返回5;4+8是个表达式;x+y也是个表达式,它返 回x+y的结果。正由于else是强制的,if语句一定会返回某个值,所以说if语句也是个表达式。如果要给刚刚定义的函数的结果都加上1,可以如此修改:
{{
doubleSmallNumber' x = (if x > 100 then x else x*2) + 1
}}
若是去掉括号,那就会只在小于100的时候加1。注意函数名最后的那个单引号,它没有任何特殊含义,只是一个函数名的合法字符罢了。通常,我们使用单引号来区分一个稍经修改但差别不大的函数。定义这样的函数也是可以的:
{{
conanO'Brien = "It's a-me, Conan O'Brien!"
}}
在这里有两点需要注意。首先就是我们没有大写conan的首字母,因为首字母大写的函数是不允许的,稍后我们将讨论其原因;另外就是这个函数并没有任何参数。没有参数的函数通常被称作“定义”(或者“名字”),一旦定义,conanO'Brien就与字符串"It's a-me, Conan O'Brien!"完全等价,且它的值不可以修改。
List入门
[$img/list.png]
在Haskell中,List就像现实世界中的购物单一样重要。它是最常用的数据结构,并且十分强大,灵活地使用它可以解决很多问题。本节我们将对List,字符串和list comprehension有个初步了解。 在Haskell中,List是一种单类型的数据结构,可以用来存储多个类型相同的元素。我们可以在里面装一组数字或者一组字符,但不能把字符和数字装在一起。
在ghci下,我们可以使用let关键字来定义一个常量。在ghci下执行
let a =1
与在脚本中编写a=1是等价的。
{{
ghci> let lostNumbers = [4,8,15,16,23,42]
ghci> lostNumbers
[4,8,15,16,23,42]
}}
如你所见,一个List由方括号括起,其中的元素用逗号分隔开来。若试图写[1,2,'a',3,'b','c',4]
这样的List,Haskell就会报出这几个字符不是数字的错误。字符串实际上就是一组字符的List,"Hello"只是['h','e','l','l','o']
的语法糖而已。所以我们可以使用处理List的函数来对字符串进行操作。 将两个List合并是很常见的操作,这可以通过++
运算符实现。
{{ ghci> [1,2,3,4] ++ [9,10,11,12] [1,2,3,4,9,10,11,12] ghci> "hello" ++ " " ++ "world" "hello world" ghci> ['w','o'] ++ ['o','t'] "woot" }}
在使用++
运算符处理长字符串时要格外小心(对长List也是同样),Haskell会遍历整个的List(++
符号左边的那个)。在处理较短的字符串时问题还不大,但要是在一个5000万长度的List上追加元素,那可得执行好一会儿了。所以说,用:
运算符往一个List前端插入元素会是更好的选择。
{{
ghci> 'A':" SMALL CAT"
"A SMALL CAT"
ghci> 5:[1,2,3,4,5]
[5,1,2,3,4,5]
}}
**:**运算符可以连接一个元素到一个List或者字符串之中,而++
运算符则是连接两个List。若要使用++运算符连接单个元素到一个List之中,就用方括号把它括起使之成为单个元素的List。[1,2,3]
实际上是1:2:3:[]
的语法糖。[]
表示一个空List,若要从前端插入3,它就成了[3]
,再插入2,它就成了[2,3]
,以此类推。
[],[[]],[[],[],[]]
是不同的。第一个是一个空的List,第二个是含有一个空List的List,第三个是含有三个空List的List。
若是要按照索引取得List中的元素,可以使用!!运算符,索引的下标为0。
{{
ghci> "Steve Buscemi" !! 6
'B'
ghci> [9.4,33.2,96.2,11.2,23.25] !! 1
33.2
}}
但你若是试图在一个只含有4个元素的List中取它的第6个元素,就会报错。要小心!
List同样也可以用来装List,甚至是List的List的List:
{{
ghci> let b = [[1,2,3,4],[5,3,3,3],[1,2,2,3,4],[1,2,3]]
ghci> b
[[1,2,3,4],[5,3,3,3],[1,2,2,3,4],[1,2,3]]
ghci> b ++ [[1,1,1,1]]
[[1,2,3,4],[5,3,3,3],[1,2,2,3,4],[1,2,3],[1,1,1,1]]
ghci> [6,6,6]:b
[[6,6,6],[1,2,3,4],[5,3,3,3],[1,2,2,3,4],[1,2,3]]
ghci> b !! 2
[1,2,2,3,4]
}}
List中的List可以是不同长度,但必须得是相同的类型。如不可以在List中混合放置字符和数组相同,混合放置数值和字符的List也是同样不可以的。当List内装有可比较的元素时,使用 > 和 >=可以比较List的大小。它会先比较第一个元素,若它们的值相等,则比较下一个,以此类推。
{{ ghci> [3,2,1] > [2,1,0] True ghci> [3,2,1] > [2,10,100] True ghci> [3,4,2] > [3,4] True ghci> [3,4,2] > [2,4] True ghci> [3,4,2] == [3,4,2] True }}
还可以对List做啥?如下是几个常用的函数:
head返回一个List的头部,也就是List的首个元素。
{{ ghci> head [5,4,3,2,1] 5 }}
tail返回一个List的尾部,也就是List除去头部之后的部分。
{{ ghci> tail [5,4,3,2,1] [4,3,2,1] }}
last返回一个List的最后一个元素。
{{ ghci> last [5,4,3,2,1] 1 }}
init返回一个List除去最后一个元素的部分。
{{ ghci> init [5,4,3,2,1] [5,4,3,2] }}
如果我们把List想象为一头怪兽,那这就是它的样子:
[img/listmonster.png]
试一下,若是取一个空List的head又会怎样?
{{ ghci> head [] *** Exception: Prelude.head: empty list }}
omg,它翻脸了!怪兽压根就不存在,head又从何而来?在使用head,tail,last和init时要小心别用到空的List上,这个错误不会在编译时被捕获。所以说做些工作以防止从空List中取值会是个好的做法。
length返回一个List的长度。
{{ ghci> length [5,4,3,2,1] 5 }}
null检查一个List是否为空。如果是,则返回True,否则返回False。应当避免使用xs==[]之类的语句来判断List是否为空,使用null会更好。
{{ ghci> null [1,2,3] False ghci> null [] True }}
reverse将一个List反转
{{ ghci> reverse [5,4,3,2,1] [1,2,3,4,5] }}
take返回一个List的前几个元素,看:
{{ ghci> take 3 [5,4,3,2,1] [5,4,3] ghci> take 1 [3,9,3] [3] ghci> take 5 [1,2] [1,2] ghci> take 0 [6,6,6] [] }}
如上,若是试图取超过List长度的元素个数,只能得到原List。若take 0个元素,则会得到一个空List!drop与take的用法大体相同,它会删除一个List中的前几个元素。
{{ ghci> drop 3 [8,4,2,1,5,6] [1,5,6] ghci> drop 0 [1,2,3,4] [1,2,3,4] ghci> drop 100 [1,2,3,4] [] }}
maximum返回一个List中最大的那个元素。minimum返回最小的。
{{ ghci> minimum [8,4,2,1,5,6] 1 ghci> maximum [1,9,2,3,4] 9 }}
sum返回一个List中所有元素的和。product返回一个List中所有元素的积。
{{ ghci> sum [5,2,1,6,3,2,5,7] 31 ghci> product [6,2,1,2] 24 ghci> product [1,2,5,6,7,9,2,0] 0 }}
elem判断一个元素是否在包含于一个List,通常以中缀函数的形式调用它。
{{
ghci> 4 elem
[3,4,5,6]
True
ghci> 10 elem
[3,4,5,6]
False
}}
这就是几个基本的List操作函数,我们会在往后的一节中了解更多的函数。
德州区间
[$img/cowboy.png]
该怎样得到一个包含1到20之间所有数的List呢? 我们完全可以用手把它全打出来,但显而易见,这并不是完美人士的方案,他们都用区间(Range)。区间是构造List方法之一,而其中的值必须是可枚举的,像1、2、3、4...字符同样也可以枚举,字母表就是A..Z所有字符的枚举。然而人名就不可以枚举了,"john"后面是谁?我不知道。
要得到包含1到20中所有自然数的List,只要[1..20]
即可,这与用手写 [1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20]
是完全等价的。其实用手写一两个还不是什么大事,但若是手写一个非常长的List那就一定是笨得可以了。
{{ ghci> [1..20] [1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20] ghci> ['a'..'z'] "abcdefghijklmnopqrstuvwxyz" ghci> ['K'..'Z'] "KLMNOPQRSTUVWXYZ" }}
区间很cool,允许你申明一个步长。要得到1到20间所有的偶数或者3的倍数该怎样?
{{ ghci> [2,4..20] [2,4,6,8,10,12,14,16,18,20] ghci> [3,6..20] [3,6,9,12,15,18] }}
仅需用逗号将前两个元素隔开,再标上上限即可。尽管区间很聪明,但它恐怕还满足不了一些人对它的期许。你就不能通过[1,2,4..100]
这样的语句来获得所有2的幂。一方面是因为步长只能标明一次,另一方面就是仅凭前几项,数组的后项是不能确定的。要得到20到1的List,[20..1]
是不可以的。必须得[20,19..1]
。在区间中使用浮点数要格外小心!出于定义的原因,浮点数并不精确。若是使用浮点数的话,你就会得到如下的糟糕结果
{{ ghci> [0.1, 0.3 .. 1] [0.1,0.3,0.5,0.7,0.8999999999999999,1.0999999999999999] }}
我的建议就是避免在区间中使用浮点数。
你也可以不标明区间的上限,从而得到一个无限长度的List。在后面我们会讲解关于无限List的更多细节。取前24个13的倍数该怎样?恩,你完全可以[13,26..24*13]
,但有更好的方法: take 24 [13,26..]
。
由于Haskell是惰性的,它不会对无限长度的List求值,否则会没完没了的。它会等着,看你会从它那儿取多少。在这里它见你只要24个元素,便欣然交差。如下是几个生成无限List的函数cycle接受一个List做参数并返回一个无限List。如果你想看一下它的所有运算结果,它就会运行个没完没了了,所以应该在某处划好范围。
{{ ghci> take 10 (cycle [1,2,3]) [1,2,3,1,2,3,1,2,3,1] ghci> take 12 (cycle "LOL ") "LOL LOL LOL " }}
repeat接受一个值作参数,并返回一个仅包含该值的无限List。这与用cycle处理单元素List差不多。
{{ ghci> take 10 (repeat 5) [5,5,5,5,5,5,5,5,5,5] }}
其实,你若只是想得到包含相同元素的List,使用replicate会更简单,如replicate 3 10
,得[10,10,10]
。
我是List Comprehension
[$img/kermit.png]
学过数学的你对集合的comprehension(Set Comprehension)概念一定不会陌生。通过它,可以从既有的集合中按照规则产生一个新集合。前十个偶数的set comprehension可以表示为[img/setnotation.png],竖线左端的部分是输出函数,x是变量,N是输入集合。在Haskell下,我们可以通过类似take 10 [2,4..]
的代码来实现。但若是把简单的乘2改成更复杂的函数操作该怎么办呢?用list comprehension,它与set comprehension十分的相似,用它取前十个偶数轻而易举。这个list comprehension可以表示为:
{{ ghci> [x*2 | x <- [1..10]] [2,4,6,8,10,12,14,16,18,20] }}
如你所见,结果正确。给这个comprehension再添个限制条件(predicate),它与前面的条件由一个逗号分隔。在这里,我们要求只取乘以2后大于等于12的元素。
{{ ghci> [x2 | x <- [1..10], x2 >= 12] [12,14,16,18,20] }}
cool,灵了。若是取50到100间所有除7的余数为3的元素该怎么办?简单:
{{
ghci> [ x | x <- [50..100], x mod
7 == 3]
[52,59,66,73,80,87,94]
}}
成功!从一个List中筛选出符合特定限制条件的操作也可以称为过滤(flitering)。即取一组数并且按照一定的限制条件过滤它们。再举个例子吧,假如我们想要一个comprehension,它能够使list中所有大于10的奇数变为“BANG”,小于10的奇数变为“BOOM”,其他则统统扔掉。方便重用起见,我们将这个comprehension置于一个函数之中。
{{
boomBangs xs = [ if x < 10 then "BOOM!" else "BANG!" | x <- xs, odd x]
}}
这个comprehension的最后部分就是限制条件,使用odd函数判断是否为奇数:返回True,就是奇数,该List中的元素才被包含。
{{ ghci> boomBangs [7..13] ["BOOM!","BOOM!","BANG!","BANG!"] }}
也可以加多个限制条件。若要达到10到20间所有不等于13,15或19的数,可以这样:
{{ ghci> [ x | x <- [10..20], x /= 13, x /= 15, x /= 19] [10,11,12,14,16,17,18,20] }}
除了多个限制条件之外,从多个List中取元素也是可以的。这样的话comprehension会把所有的元素组合交付给我们的输出函数。在不过滤的前提下,取自两个长度为4的集合的comprehension会产生一个长度为16的List。假设有两个List,[2,5,10]
和[8,10,11]
, 要取它们所有组合的积,可以这样:
{{
ghci> [ x*y | x <- [2,5,10], y <- [8,10,11]]
[16,20,22,40,50,55,80,100,110]
}}
意料之中,得到的新List长度为9。若只取乘积为50的结果该如何?
{{
ghci> [ x*y | x <-[2,5,10], y <- [8,10,11], x*y > 50]
[55,80,100,110]
}}
取个包含一组名词和形容词的List comprehension吧,写诗的话也许用得着。
{{
ghci> let nouns = ["hobo","frog","pope"]
ghci> let adjectives = ["lazy","grouchy","scheming"]
ghci> [adjective ++ " " ++ noun | adjective <- adjectives, noun <- nouns]
["lazy hobo","lazy frog","lazy pope","grouchy hobo","grouchy frog", "grouchy pope","scheming hobo","scheming frog","scheming pope"]
}}
明白!让我们编写自己的length函数吧!就叫做length'!
{{
length' xs = sum [1 | _ <- xs]
}}
_
表示我们并不关心从List中取什么值,与其弄个永远不用的变量,不如直接一个_
。这个函数将一个List中所有元素置换为1,并且使其相加求和。得到的结果便是我们的List长度。友情提示:字符串也是List,完全可以使用list comprehension来处理字符串。如下是个除去字符串中所有非大写字母的函数:
{{
removeNonUppercase st = [ c | c <- st, c `elem` ['A'..'Z']]
}}
测试一下:
{{
ghci> removeNonUppercase "Hahaha! Ahahaha!"
"HA"
ghci> removeNonUppercase "IdontLIKEFROGS"
"ILIKEFROGS"
}}
在这里,限制条件做了所有的工作。它说:只有在['A'..'Z']
之间的字符才可以被包含。
若操作含有List的List,使用嵌套的List comprehension也是可以的。假设有个包含许多数值的List的List,让我们在不拆开它的前提下除去其中的所有奇数:
{{
ghci> let xxs = [[1,3,5,2,3,1,2,4,5],[1,2,3,4,5,6,7,8,9],[1,2,4,2,1,6,3,1,3,2,3,6]]
ghci> [ [ x | x <- xs, even x ] | xs <- xxs]
[[2,2,4],[2,4,6,8],[2,4,2,6,2,6]]
}}
将List Comprehension分成多行也是可以的。若非在GHCI之下,还是将List Comprehension分成多行好,尤其是需要嵌套的时候。
Tuple
[$img/tuple.png]
从某种意义上讲,Tuple(元组)很像List--都是将多个值存入一个个体的容器。但它们却有着本质的不同,一组数字的List就是一组数字,它们的类型相同,且不关心其中包含元素的数量。而Tuple则要求你对需要组合的数据的数目非常的明确,它的类型取决于其中项的数目与其各自的类型。Tuple中的项由括号括起,并由逗号隔开。
另外的不同之处就是Tuple中的项不必为同一类型,在Tuple里可以存入多类型项的组合。
动脑筋,在Haskell中表示二维向量该如何?使用List是一种方法,它倒也工作良好。若要将一组向量置于一个List中来表示平面图形又该怎样?我们可以写类似[[1,2],[8,11],[4,5]]
的代码来实现。但问题在于,[[1,2],[8,11,5],[4,5]]
也是同样合法的,因为其中元素的类型都相同。尽管这样并不靠谱,但编译时并不会报错。然而一个长度为2的Tuple(也可以称作序对,Pair),是一个独立的类型,这便意味着一个包含一组序对的List不能再加入一个三元组,所以说把原先的方括号改为圆括号使用Tuple会更好:[(1,2),(8,11),(4,5)]
。若试图表示这样的图形:[(1,2),(8,11,5),(4,5)]
,就会报出以下的错误:
{{
Couldn't match expected type `(t, t1)'
against inferred type `(t2, t3, t4)'
In the expression: (8, 11, 5)
In the expression: [(1, 2), (8, 11, 5), (4, 5)]
In the definition of `it': it = [(1, 2), (8, 11, 5), (4, 5)]
}}
这告诉我们说程序在试图将序对和三元组置于同一List中,而这是不允许的。同样[(1,2),("one",2)]
这样的List也不行,因为 其中的第一个Tuple是一对数字,而第二个Tuple却成了一个字符串和一个数字。Tuple可以用来储存多个数据,如,我们要表示一个人的名字与年 龄,可以使用这样的Tuple:("Christopher", "Walken", 55)
。从这个例子里也可以看出,Tuple中也可以存储List。
使用Tuple前应当事先明确一条数据中应该由多少个项。每个不同长度的Tuple都是独立的类型,所以你就不可以写个函数来给它追加元素。而唯一能做的,就是通过函数来给一个List追加序对,三元组或是四元组等内容。
可以有单元素的List,但Tuple不行。想想看,单元素的Tuple本身就只有一个值,对我们又有啥意义?不靠谱。
同List相同,只要其中的项是可比较的,Tuple也可以比较大小,只是你不可以像比较不同长度的List那样比较不同长度的Tuple。如下是两个有用的序对操作函数:
fst返回一个序对的首项。
{{
ghci> fst (8,11)
8
ghci> fst ("Wow", False)
"Wow"
}}
snd返回序对的尾项。
{{
ghci> snd (8,11)
11
ghci> snd ("Wow", False)
False
}}
这两个函数仅对序对有效,而不能应用于三元组,四元组和五元组之上。稍后,我们将过一遍从Tuple中取数据的所有方式。
有个函数很cool,它就是zip。它可以用来生成一组序对(Pair)的List。它取两个List,然后将它们交叉配对,形成一组序对的List。它很简单,却很实用,尤其是你需要组合或是遍历两个List时。如下是个例子:
{{
ghci> zip [1,2,3,4,5] [5,5,5,5,5]
[(1,5),(2,5),(3,5),(4,5),(5,5)]
ghci> zip [1 .. 5] ["one", "two", "three", "four", "five"]
[(1,"one"),(2,"two"),(3,"three"),(4,"four"),(5,"five")]
}}
它把元素配对并返回一个新的List。第一个元素配第一个,第二个元素配第二个..以此类推。注意,由于序对中可以含有不同的类型,zip函数可能会将不同类型的序对组合在一起。若是两个不同长度的List会怎么样?
{{
ghci> zip [5,3,2,6,2,7,2,5,4,6,6] ["im","a","turtle"]
[(5,"im"),(3,"a"),(2,"turtle")]
}}
较长的那个会在中间断开,去匹配较短的那个。由于Haskell是惰性的,使用zip同时处理有限和无限的List也是可以的:
{{
ghci> zip [1..] ["apple", "orange", "cherry", "mango"]
[(1,"apple"),(2,"orange"),(3,"cherry"),(4,"mango")]
}}
接下来考虑一个同时应用到List和Tuple的问题:如何取得所有三边长度皆为整数且小于等于10,周长为24的直角三角形?首先,把所有三边长度小于等于10的三角形都列出来:
{{
ghci> let triangles = [ (a,b,c) | c <- [1..10], b <- [1..10], a <- [1..10] ]
}}
刚才我们是从三个List中取值,并且通过输出函数将其组合为一个三元组。只要在ghci下边调用triangle,你就会得到所有三边都小于等于 10的三角形。我们接下来给它添加一个限制条件,令其必须为直角三角形。同时也考虑上b边要短于斜边,a边要短于b边情况:
{{
ghci> let rightTriangles = [ (a,b,c) | c <- [1..10], b <- [1..c], a <- [1..b], a^2 + b^2 == c^2]
}}
已经差不多了。最后修改函数,告诉它只要周长为24的三角形。
{{
ghci> let rightTriangles' = [ (a,b,c) | c <- [1..10], b <- [1..c], a <- [1..b], a^2 + b^2 == c^2, a+b+c == 24]
ghci> rightTriangles'
[(6,8,10)]
}}
得到正确结果!这便是函数式编程的一般思路:先取一个初始的集合并将其变形,执行过滤条件,最终取得正确的结果。