OCaml 入门基础

1. 注释与输入输出

OCaml注释如下:

1
(* hello world *)

输入输出如下:

  • 输入
    • read_int(): 读入一个整数
    • read_float(): 读入一个浮点数
    • read_line(): 读入一个字符串
  • 输出
    • print_char ‘a’: 打印字符
    • print_int 2: 打印数字
    • print_float 3.4: 打印浮点数
    • print_newline(): 打印换行
    • print_string “hello world”: 打印字符串
    • print_endline “hello world”: 打印字符串,并换行
    • Printf.printf “int %i, float %f, char %c, string %s\n” 3 3.2 ‘a’ “ok”;;: 打印格式化字符串

(注:OCaml中的函数调用:不需要括号,除非无参数时才需要;各参数之间用空格隔开。)

2. 编译与运行

OCaml代码文件以.ml结尾。

  • 解释运行:ocaml xxx.ml
  • 编译运行
    • 编译生成可重定位文件:
      • 字节码:ocamlc -c xxx.ml -o xxx.cmo
      • 目标码:ocamlc -c xxx.ml -o xxx.o
    • 链接生成目标文件:ocamlc -o xxx xxx.cmo
    • 直接生成目标文件:
      • 字节码:ocamlc -o xxx xxx.ml
      • 目标码:ocamlopt -o xxx xxx.ml

3. 变量

变量名开头字母不能大写,若大写则会被当作联合类型中的构造子。

3.1. 基本类型

  • int: 整数类型
  • float: 浮点类型,浮点常数必须带小数点.,否则会被视为int类型
  • char: 字符类型
  • string: 字符串类型
  • unit: 啥都不是类型

在OCaml中,没有强制类型转换,整型只能与整型变量做运算。

若要类型转换,需使用相应函数,如下:

  • float_of_int 1: int => float
  • int_of_float 2.6: float => int
  • int_of_string “-23”: string => int
  • float_of_string “1.2e3”: string => float
  • string_of_int 12: int => string
  • string_of_float (-2.3): float => string

字符与ASCII码:

  • int_of_char ‘x’: 获取字符x的ASCII码值
  • char_of_int 120: 把ASCII码转换到字符

3.2. let 定义

  • let <变量1> = <表达式1> and <变量2> = <表达式2>: 全局定义
    • 必须赋初值
    • 可重复定义一个变量
    • 不能在表达式内部使用
  • let <变量1> = <表达式1> and <变量2> = <表达式2> in <表达式3>: 局部定义
    • 必须赋初值
    • 可重复定义一个变量
    • 可在表达式内部使用
    • 变量1,2作用域局限于表达式3

注意:let定义的变量是无法修改!!!修改需要使用命令式的方式,后文细说。

3.3. 多态类型

4. 表达式

4.1. 算术运算

  • (a/b) * b + (a mod b): 整型运算+, -, *, /, mod
  • 4e2 *. 2. /. 3. +. 1.: 浮点型运算,运算符必须带小数点.

4.2. 逻辑运算

  • not true: 非
  • true && false: 与
  • true || false: 或

4.3. 比较运算

>, <, >=, <=如常

相等与不等:

  • = and <>: 结构化比较,对比结构内部的子元素
  • == and !=: 物理比较,比较变量在内存中的存储地址(即比较地址)

对于非结构化数据,两种相等于不等相同。基本类型中,整型和字符非结构化数据浮点型和字符串都是结构化数据

4.4. 位运算

  • op1 land op2: 按位与
  • op1 lor op2: 按位或
  • op1 lxor op2: 按位异或
  • op1 lsl op2: op1左移op2位
  • op1 lsr op2: op1右移op2位
  • op1 asr op2: op1算术右移op2位

4.5. if 表达式

格式:

1
if <条件表达式> then <表达式1> [ else <表达式2> ]

示例:

1
2
3
4
5
# if 1<2 then
    true && false
  else
    true || false;;
- : bool = false

4.6. while 表达式

纯函数式语言没有循环。惊不惊喜,意不意外。

需要循环完成的工作,可以通过递归函数来完成。

4.7. 模式匹配表达式

强大至极

格式:

1
2
3
4
5
match <表达式> with
  | <模式1> [when <条件1>] -> <表达式1>  (* 第一个 | 可以省略 *)
  | <模式2> [when <条件2>] -> <表达式2>
    ...
  | <模式n> [when <条件n>] -> <表达式n>

基础使用示例:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
(* 取反 *)
let neg x =
  match x with
    | true -> false
    | false -> true
;;
(* 类型:val neg : bool -> bool = <fun> *)

(* 是否为零 *)
let is_zero x =
  match x with
    | 0 -> true
    | _ -> false  (* 可以使用通配符 *)
;;
(* 类型:val is_zero : int -> bool = <fun> *)

(* 异或 *)
let xor z =
  match z with
      (false, false) -> false (* 第一个 | 可以省略 *)
    | (false, true) -> true
    | (true, false) -> true
    | (true, true) -> false
;;
(* 类型:val xor : bool * bool -> bool = <fun> *)

let xor x y =
  match x,y with
      (false, u) -> u     (* 在模式中可以使用变量 *)
    | (true, u) -> not u
;;
(* 类型:val xor : bool -> bool -> bool = <fun> *)

let f (c:char) : string =
  match c with
      '0'..'9' -> "digit"       (* 可以使用 <字符>..<字符> 字符区间模式 *)
    | 'a'..'z' -> "lower char"
    | 'A'..'Z' -> "upper char"
    | _        -> "other char"
;;
(* val f : char -> string = <fun> *)

let int_of_bool = function    (* function 可以直接做模式匹配,函数不带参数 *)
    true -> 1
  | false -> 0
;;
(* val int_of_bool : bool -> int = <fun> *)

5. 函数

First of all, 函数是变量。

5.1. 简单函数

  • let <fun_name> <参数1> <参数2>…<参数n> = <表达式>
  • let <fun_name> (<参数1>, <参数2>, …<参数n>) = <表达式>: 将多个参数合并到一个元组中

示例:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
let add x y =
  x + y ;;
(* 类型:val add : int -> int -> int = <fun> *)

print_int (add 1 2) ;;  (* 3- : unit = () *)

(* 部分作用/部分求值 *)
let inc x =
  add x 1 ;;
(* val inc : int -> int = <fun> *)

(* 将多个参数合并到一个元组中,但这种方式不能部分求值 *)
let plus3 (a, b, c) =
  a + b + c ;;
(* val plus3 : int * int * int -> int = <fun> *)

print_int (plus3 (1,2,3)) ;;  (* 6- : unit = () *)

5.2. function 和 fun

  • let <fun_name> = function <参数> -> <表达式>: 只能有一个参数,可用于模式匹配
  • let <fun_name> = fun <参数1> <参数2>…<参数n> -> <表达式>: 多参数

5.3. 高阶函数

函数作参和作返回值

5.4. 递归函数

在函数名前添加rec关键字,指定是递归函数。

1
let rec <fun_name> <参数1> <参数2>...<参数n> = <表达式>

示例:

1
2
3
4
5
6
7
(* 普通递归 *)
let rec factorial n =
  if n = 0 then
    1
  else
    n * factorial (n-1) ;;
(* val factorial : int -> int = <fun> *)

尾递归实现循环,在参数中加入辅助函数。

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
(* 尾递归实现循环 *)
let fib n =
  if n < 3 then
    0
  else
    let rec fib_tail n n_1 n_2 =
      if n = 3 then
        n_1+n_2
      else
        fib_tail (n-1) (n_1+n_2) n_1
    in fib_tail n 1 1
;;
(* val fib : int -> int = <fun> *)

6. 数据结构

6.1. 类型的显式定义(type)

格式:

1
type [<类型参数>] <类型标识符> = <类型定义表达式>

6.2. 元组类型(tuple)

格式:

<元素1>, <元素2>…<元素n>

每个元素的类型可以不相同。

元组的类型描述为:

<元素1类型> * <元素2类型> *…<元素n类型>

示例:

1
2
3
4
5
6
# let a = "Number", 1;;
val a : string * int = ("Number", 1)
# let b = "pi", 3.14, 5 ;;
val b : string * float * int = ("pi", 3.14, 5)
# let c = 1, (2,3), ((4,5), 6) ;;
val c : int * (int * int) * ((int * int) * int) = (1, (2, 3), ((4, 5), 6))

只有二个元素的元组也称作对偶

函数fst和snd分别取对偶的第一个和第二个分量。

6.3. 记录类型(结构体 record)

定义一个记录类型:

1
type <类型标识符> = { <字段名1>:<类型1>; ... ; <字段名n>:<类型n> }

创建一个记录类型变量:

1
{ <字段名1> = <表达式1>; ... ; <字段名n> = <表达式n> }

访问记录类型中的字段:

1
<记录类型变量>.<字段名>

注意:上述记录类型不可修改!!!

6.4. 联合类型/变体(加强版 union)

格式:

1
2
3
4
type [<多态类型变量>] <类型标识符> =
  <构造子名1> [of <参数类型1>]
  ...
  <构造子名n> [of <参数类型n>]

注:构造子名首字母必须大写

6.4.1. 无参构造子(枚举类型)

无参构造子。类似于枚举类型,构造子能和常数或者布尔值一样使用

示例:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
type seasons = Spring | Summer | Autumn | Winter ;;

let int_of_seasons = function
    Spring -> 1
  | Summer -> 2
  | Autumn -> 3
  | Winter -> 4
;;
(* val int_of_seasons : seasons -> int = <fun> *)

int_of_seasons Autumn ;;  (* - : int = 3 *)

6.4.2. 带参构造子

带参构造子。构造子相当于类型,可以用于定义变量

示例:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
type num = Int of int | Float of float ;;

Int 3 ;;  (* - : num = Int 3 *)

let add_num = function
    (Int m, Int n) -> Int (m+n)
  | (Int m, Float n) -> Float ((float_of_int m) +. n)
  | (Float m, Int n) -> Float (m +. (float_of_int n))
  | (Float m, Float n) -> Float (m +. n)
;;
(* val add_num : num * num -> num = <fun> *)

6.4.3. 递归类型

示例,定义一个二叉树:

1
2
3
4
type inttree =
    Leaf of int
  | Node of inttree * inttree (* *号表明是元组类型,不是乘号 *)
;;

6.4.4. 带多态变量的联合类型

6.4.5. 多态变体

6.5. 表(list 不可以修改)

类型描述:

1
<类型> list

6.5.1. 创建

1
[ e1; e2; ... en;]

ei可以是变量或者常量,但类型必须相同。

6.5.2. 添加

头插:

1
2
# 1::[2;3];;
- : int list = [1; 2; 3]

追加:

1
2
3
4
# List.append [1;2] [3;4] ;;
- : int list = [1; 2; 3; 4]
# [1;2] @ [3;4] ;;
- : int list = [1; 2; 3; 4]

6.5.3. 取表头表尾

表头是第一个元素,表尾是除第一个元素外的子表。

1
2
3
4
# List.hd [1;2;3] ;;
- : int = 1
# List.tl [1;2;3] ;;
- : int list = [2; 3]

注意:表中元素也不可以修改!!!

6.6. 汇总

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
OCaml 名字     类型定义的例子                    用法

list            int list                       [1; 2; 3]
tuple          int * string                   (3, "hello")
record         type pair =                    { a = 3; b = "hello" }
                 { a: int; b: string }
变体            type foo =
                 | Int of int                 Int 3
                 | Pair of int * string
变体            type sign =
                 | Positive                   Positive
                 | Zero                       Zero
                 | Negative
参数化变体       type 'a my_list =
                 | Empty                      Cons (1, Cons (2, Empty))
                 | Cons of 'a * 'a my_list

7. 模块

7.1. 文件即模块

如果有一个util.ml文件:

1
2
3
4
5
(* util.ml *)
let msg = "helloworld" ;;
let printMsg =
  print_endline msg
;;

那么,可以在另一个main.ml文件中:

1
print_endline Util.msg ;;

调用Util模块(即util.ml文件)中的变量或者函数。

如果还存在一个util.mli文件,那它就是util.ml模块的接口。未在util.mli中出现的变量或函数,都不能被调用。同时,util.mli文件需要在util.ml文件编译前编译,如下:

1
ocamlc -c util.mli -o util.cmi

7.2. 接口和模块定义

接口定义

1
2
3
4
module type <接口名> =
  sig
    <接口定义体>
  end

<接口名>是一个大写字母开头的标识符,<接口定义体>中包括了 type 定义、函数的类型描述等内容。

模块定义:

1
2
3
4
module <模块名> [:<模块接口>] =
  struct
    <模块体>
  end

<模块名>是一个大写字母开头的标识符,<模块体>中包括了 type 定义和 let 定义。

8. 命令式程序设计

8.1. 可更改变量

定义:

1
let <变量> = ref <表达式> ;;

引用:

1
!<变量>

赋值:

1
<变量> := <表达式>

8.2. 可更改记录

定义:

1
2
3
4
5
type <记录类型> = {
  ...
  mutable <分量名> : <分量类型>;
  ...
}

赋值:

1
<记录>.<分量> <- <表达式>

8.3. 可修改的数组(Array)

定义:

1
let arr = [|1;2;3|] ;;

访问:

1
<数组>.(<下标>) (* 如:mart.(1).(2) *)

赋值:

1
<数组>.(<下标>) <- <表达式>

常用函数:

1
2
3
4
Array.make 4 1; (* 创建长度为4的一维数组,都初始化为1 *)
Array.make_matrix 2 3 0; (* 创建行为2列为3的二维数组,都初始化为0 *)
Array.length arr; (* 返回数组长度 *)
Array.iter print_int [|1;2;3|]; (* 把一个函数作用于数组每个元素上 *)

8.4. for循环

1
2
3
4
5
for <变量>=<初始表达式> to <终止表达式> do
  <表达式1>;
  ...
  <表达式n>;
done
Licensed under CC BY-NC-SA 4.0