Sei sulla strada giusta. Ci sono alcuni problemi nel parser. Pubblicherò il codice corretto, quindi spiegherò le modifiche.
import scala.util.parsing.combinator._
import scala.util.parsing.combinator.syntactical._
case class Book (name: String, isbn: String) {
def niceName = name + " : " + isbn
}
object BookParser extends StandardTokenParsers {
lexical.reserved += ("book","has","isbn")
def bookSpec: Parser[Book] = "book" ~ ident ~ "has" ~ "isbn" ~ ident ^^ {
case "book" ~ name ~ "has" ~ "isbn" ~ isbn => new Book(name, isbn) }
def parse (s: String) = {
val tokens = new lexical.Scanner(s)
phrase(bookSpec)(tokens)
}
def test (exprString : String) = {
parse (exprString) match {
case Success(book, _) => println("Book: " + book.niceName)
case Failure(msg, _) => println("Failure: " + msg)
case Error(msg, _) => println("Error: " + msg)
}
}
def main (args: Array[String]) = {
test ("book ABC has isbn DEF")
}
}
1. valore di ritorno Parser
Al fine di restituire un libro da un parser, è necessario dare il tipo inferencer qualche aiuto. Ho modificato la definizione della funzione bookSpec in modo esplicito: restituisce un parser [Libro]. Cioè, restituisce un oggetto che è un parser per i libri.
2. stringLit
La funzione stringLit si è utilizzato proviene dalla StdTokenParsers trait. stringLit è una funzione che restituisce Parser [String], ma il modello che corrisponde include le virgolette utilizzate dalla maggior parte delle lingue per delimitare un letterale stringa. Se sei soddisfatto delle parole con doppie virgolette nel tuo DSL, stringLit è ciò che desideri. Nell'interesse della semplicità, ho sostituito stringLit con ident. ident cerca un identificatore di linguaggio Java. Questo non è davvero il formato giusto per i codici ISBN, ma ha superato il tuo caso di test. :-)
Per far corrispondere correttamente i codici ISBN, penso che sarà necessario utilizzare un'espressione regolare anziché idents.
3. sequenza ignore-sinistra
tuo matcher utilizzato una serie di ~> combinatori. Questa è una funzione che prende due oggetti Parser [_] e restituisce un parser che riconosce entrambi in sequenza, quindi restituisce il risultato del lato destro. Usando tutta una catena di essi per arrivare alla stringa finaleLit, il parser ignorerebbe tutto tranne l'ultima parola nella frase. Ciò significa che butterebbe via anche il nome del libro.
Inoltre, quando si utilizza ~> o < ~, i token ignorati non dovrebbero apparire nella corrispondenza del modello.
Per semplicità, ho modificato tutto in semplici funzioni di sequenza e ho lasciato i token extra nel pattern match.
4. Risultati corrispondenti
Il metodo di prova deve corrispondere tutti i possibili risultati della funzione() parse. Quindi, ho aggiunto i casi Failure() e Error().Inoltre, anche Success include sia il valore restituito e l'oggetto Reader. Non ci interessa il lettore, quindi ho semplicemente usato "_" per ignorarlo nel pattern match.
Spero che questo aiuti!
eccellente risposta vi ringrazio - sono state passando attraverso tutti i libri Scala attuali e futuri, e questo è una risposta migliore rispetto alle due Ho un accordo con questo (quello di Martin Odersky e quello di Wampler e Payne) – ShaunL