# Filtrage par motifs

Le filtrage par motifs (ou _pattern matching_) est une technique permettant de choisir le comportement d'un morceau de code en fonction d'un paramètre.
C'est une fonctionnalité assez puissante qui simplifie considérablement le code.
Des langages comme le C ou le C++ ne disposant pas d'un tel outil doivent faire appel à des expédients plus ou moins élégants : `switch`, `if`s imbriqués, méthodes virtuelles... 
Concrètement, on définit un nombre fini de _motifs_, et on associe à chacun un morceau de code à effectuer.

In [1]:
// simple example of pattern matching
// the matching is done on the argument of the function, which needs not to be explicitly named
def factorial: Int => Int = {
 case 0 => 1
 case n if n > 0 => n * factorial(n-1)
}
println(factorial(5)) // should be 120
println(factorial(-5)) // error, negative integers cannot be matched

120


Name: scala.MatchError
Message: -5 (of class java.lang.Integer)
StackTrace: $line10.$read$$iwC$$iwC$$iwC$$iwC$$anonfun$factorial$1.apply$mcII$sp(:22)
$line12.$read$$iwC$$iwC$$iwC$$iwC.(:21)
$line12.$read$$iwC$$iwC$$iwC.(:26)
$line12.$read$$iwC$$iwC.(:28)
$line12.$read$$iwC.(:30)
$line12.$read.(:32)
$line12.$read$.(:36)
$line12.$read$.()
$line12.$eval$.(:7)
$line12.$eval$.()
$line12.$eval.$print()
sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)
sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
java.lang.reflect.Method.invoke(Method.java:498)
org.apache.spark.repl.SparkIMain$ReadEvalPrint.call(SparkIMain.scala:1065)
org.apache.spark.repl.SparkIMain$Request.loadAndRun(SparkIMain.scala:1346)
org.apache.spark.repl.SparkIMain.loadAndRunReq$1(SparkIMain.scala:840)
org.apache.spark.repl.SparkIMain.interpret(SparkIMain.scala:871)
org.apache.spark.repl.SparkIMain.interpre

L'exemple ci-dessus illustre la syntaxe du pattern-matching et son utilisation possible pour la définition de fonction.
La succession des cas rend le code beaucoup plus lisible que s'il avait été écrit avec un `if`. 
Le pattern-matching commence à prendre son sens lorsque le nombre de cas croît.

In [2]:
// another simple example of pattern matching
def calc(op: String, x: Int, y: Int) = op match {
 case "+" => x+y
 case "-" => x-y
 case "*" => x*y
 case "/" => x/y
}
println(calc("+", 2, 3))
println(calc("*", 2, 3))

5
6


Mais les exemples ci-dessus ne font du filtrage que sur la valeur.
Le filtrage par motifs permet également de filtrer par types, voire de combiner les deux.

In [3]:
// pattern matching on types
def foo: Any => Int = {
 case y: Int if y < 0 => -y
 case y: Int => y+1
 case s: String => s.length()
}
println(foo(5)) // 6
println(foo(-2)) // 2
println(foo("bar")) // 3

6
2
3


On peut aussi utiliser le filtrage par motifs sur plusieurs variables en même temps.

In [4]:
// pattern matching on tuples
def add: (Int, Int) => Int = {
 case (x,y) => x+y
}
println(add(2,5))

7


Enfin, les motifs peuvent utiliser des jokers. Ceci est particulièrement utile pour définir des cas par défaut.

In [7]:
def choose: (Int, Int) => Int = {
 case (_,0) => 1
 case (n,k) if n == k => 1
 case (n,k) if n > 0 && k > 0 && k < n => choose(n-1,k-1)+choose(n-1,k)
 case _ => println("error"); -1
}

println(choose(4,2))
println(choose(2,3))

6
error
-1


## Variables dans les motifs

Dans un filtrage par motif, les variables utilisées dans la description du motif sont _fraîches_, même si elles portent le même nom qu'une autre variable utilisée précédemment. 
Elles servent à nommer les sous-éléments intéressants du motif.

In [8]:
class Match(val x: Int) {
 // x is a member of class Match
 
 // this function is intended to return true if its argument has the same value as x
 def equal: Int => Boolean = {
 // here, x is a fresh variable, local to this function, and has nothing to do with Match.x
 case x => true
 case _ => false
 }
}

val m = new Match(2)
println(m.equal(2)) // should be true
println(m.equal(3)) // we wish it to be false

true
true


Dans l'exemple ci-dessus, deux variables différentes portent le même nom `x`. 
On peut cependant faire référence à des variables existantes dans les motifs, en encadrant le nom de la variable par des accents graves.

In [9]:
class Match(val x: Int) {
 // x is a member of class Match
 
 // this function is intended to return true if its argument has the same value as x
 def equal: Int => Boolean = {
 // here, `x` indicates that we refer to the existing x, not a fresh variable
 case `x` => true
 case _ => false
 }
}

val m = new Match(2)
println(m.equal(2)) // should be true
println(m.equal(3)) // we wish it to be false

true
false


Les variables dont le nom commencent par une majuscule sont toujours considérées comme étant entre accents graves dans les motifs.
Cela permet d'allèger la syntaxe pour des variables qu'on souhaite utiliser fréquemment dans des motifs.

## Case classes

Les _case classes_ sont des classes avec les particularités suivantes (qui sont intimement liées) :
- elles sont immutables ;
- elles sont comparables par _égalité structurelle_ ;
- elles sont décomposables par filtrage de motifs.

Les case classes permettent l'implémentation de types de données algébriques, et fournissent de puissantes possibilités de filtrage de motifs. 
Cela permet d'écrire en quelques lignes des fonctionnalités qui nécessiteraient l'utilisation de visiteurs dans d'autres languages.

Les listes sont implémentées à l'aide de deux case classes :
- `Nil`, qui n'a pas de paramètres, représentant la liste vide ;
- `Cons(h, t)` où `h` est un élément et `t` une liste.
Afin d'alléger la notation, `Cons(h, t)` peut aussi s'écrire `h :: t`.

In [11]:
def listLength: List[Int] => Int = {
 case Nil => 0
 case _ :: t => 1+listLength(t)
}
println(listLength(List(0,1,1,2,3,4,5,5)))

def switch: List[Int] => List[Int] = {
 case Nil => Nil
 // patterns can be arbitrarily complex
 case x :: y :: t => y :: x :: switch(t)
}
println(switch(List(0,1,2,3,4,5)))

8
List(1, 0, 3, 2, 5, 4)


Les case classes sont souvent utilisées comme feuilles d'une arborescence d'héritage.

In [3]:
// WARNING: do not run this cell more than once
// it may confuse the kernel with multiply defined classes
class Expr
case class Plus(lhs: Expr, rhs: Expr) extends Expr
case class Constant(n: Int) extends Expr

In [5]:
def evalExpr(e: Expr): Int = e match {
 case Plus(lhs, rhs) => evalExpr(lhs) + evalExpr(rhs)
 case Constant(n) => n
}

evalExpr(Plus(Constant(3), Constant(5)))

8

## Extracteurs

Il est aussi possible d'équiper n'importe quelle classe (ou singleton) de méthodes permettant de l'utiliser dans des motifs, même si c'est pas une case class. 
Pour cela, le filtrage de motifs s'appuie sur la méthode `unapply`.

In [12]:
object Twice {
 def unapply(x: Int) = 
 if (x % 2 == 0) Some(x/2) else None
}

val x = 26
x match {
 case Twice(n) => println(n)
}

13


De manière générale, le type de retour de la méthode `unapply` est `Option[T]`, où `T` est le type de la variable qui apparaîtra dans le motif. 
Le type `Option[T]` a deux constructeurs : `None` (sans arguments) et `Some` qui a un argument. 
Dans le cas de `unapply`, `None` est utilisé pour indiquer que le motif ne correspond pas, et `Some(t)` indique que `t` est la valeur correspondante au motif.

Dans l'exemple ci-dessus, `n` est de type `Int`, la méthode `unapply` retourne un objet de type `Option[Int]`. 
La méthode `unapply` peut aussi retourner un tuple, de type `Option[(T1, T2, ... Tn)]`.

Dans le cas où le motif n'utilise pas de variables, le type de retour de `unapply` peut être `Boolean`.

In [13]:
// a pair of integers (x,y) is encoded on a single integer as 2**x * 3**y
object Pair {
 def apply(x: Int, y: Int): Int = Math.pow(2, x).toInt * Math.pow(3, y).toInt
 
 def unapply(pp: Int) = {
 var p = pp
 var (x,y) = (0,0)
 while (p%2 == 0) { x += 1; p = p/2 }
 while (p%3 == 0) { y += 1; p = p/3 }
 if (p != 1) None else Some(x,y)
 }
}
// a triple of integers (x,y,z) is encoded on a single integer as 2**x * 3**y * 5**z
object Triple {
 def apply(x: Int, y: Int, z: Int): Int = Math.pow(2, x).toInt * Math.pow(3, y).toInt * Math.pow(5, z).toInt

 def unapply(pp: Int) = {
 var p = pp
 var (x,y,z) = (0,0,0)
 while (p%2 == 0) { x +=1; p = p/2 }
 while (p%3 == 0) { y +=1; p = p/3 }
 while (p%5 == 0) { z +=1; p = p/5 }
 if (p != 1) None else Some(x,y,z)
 }
}

// NB: A(args) is a shortcut for A.apply(args)
val p = Triple(3, 5, 1)
p match {
 case Pair(x,y) => println(p.toString() + " = 2**" + x.toString() + " * 3**" + y.toString())
 case Triple(x,y,z) => println(p.toString() + " = 2**" + x.toString() + " * 3**" + y.toString() + " * 5**" + z.toString())
}

/*
p match {
 case Pair(x,y) => f(x,y)
 case Triple(x,y,z) => g(x,y,z)
}

is similar to

Pair.unapply(p) match {
 case Some(x,y) => f(x,y)
 case None => Triple.unapply(p) match {
 case Some(x,y,z) => g(x,y,z)
 }
}
*/

9720 = 2**3 * 3**5 * 5**1


Name: Syntax Error.
Message: 
StackTrace: 

In [19]:
object Even {
 def unapply(x: Int) = x % 2 == 0
}

3 match {
 // no variable in the pattern, unapply returns a Boolean
 case Even() => println("3 is even")
 case _ => println("3 is odd")
}

3 is odd


## Exercice

Implémentez des ensembles de `Int` sous forme d'arbres binaires de recherche balancés. 
L'arbre vide est noté `Nil`. 
Un arbre non-vide est constitué d'une étiquette `label` de type `Int` et de deux arbres (ses fils), `left` et `right`.
Pour tout noeud dans l'arbre, les étiquettes du fils `left` doivent être toutes inférieures (strictement) à `label`, et les étiquettes du fils `right` doivent être toutes supérieures (strictement) à `label`. 
De plus, l'arbre et tous ses sous-arbres doivent être équilibrés : la différence de hauteur des deux fils doit être inférieure ou égale à 2.

In [6]:
// WARNING: do not run this cell more than once
// it may confuse the kernel with multiply defined classes
// if it happens, you can restart the kernel
abstract class BinTree
case class Leaf extends BinTree
case class Node(label: Int, left: BinTree, right: BinTree) extends BinTree

def height(t: BinTree): Int = t match {
 case Leaf() => 0
 case Node(_, l, r) => 1 + math.max(height(l), height(r))
}

// Size of the set
def cardinal(t: BinTree): Int
// Test whether e is in t
def isin(t: BinTree, e: Int): Boolean
// Insert e in t and return the resulting set
def insert(t: BinTree, e: Int): BinTree
// Remove e from t and return the resulting set
// If e is not in t, then t is not modified
def erase(t: BinTree, e: Int): BinTree
// Set operations: union, intersection, set difference
def union(t1: BinTree, t2: BinTree): BinTree
def inter(t1: BinTree, t2: BinTree): BinTree
def diff(t1: BinTree, t2: BinTree): BinTree
// From t, retrieve the elements that satisfy predicate p
def filter(t: BinTree, p: Int => Boolean): BinTree
// Apply sequentially f to every elements of t
def apply(t: BinTree, f: Int => Unit): Unit
// Return the image of t by f
def map(t: BinTree, f: Int => Int): BinTree


Name: Syntax Error.
Message: 
StackTrace: 