Sto tentando di analizzare una semplice sintassi sensibile all'indentazione utilizzando la libreria Parslet all'interno di Ruby.Analizzatore sensibile all'indentazione utilizzando Parslet in Ruby?
Il seguente è un esempio di sintassi che sto cercando di analizzare:
level0child0
level0child1
level1child0
level1child1
level2child0
level1child2
L'albero risultante sarà simile modo:
[
{
:identifier => "level0child0",
:children => []
},
{
:identifier => "level0child1",
:children => [
{
:identifier => "level1child0",
:children => []
},
{
:identifier => "level1child1",
:children => [
{
:identifier => "level2child0",
:children => []
}
]
},
{
:identifier => "level1child2",
:children => []
},
]
}
]
Il parser che ho ora in grado di analizzare il livello di nidificazione 0 e 1 nodi, ma non può analizzare passato che:
require 'parslet'
class IndentationSensitiveParser < Parslet::Parser
rule(:indent) { str(' ') }
rule(:newline) { str("\n") }
rule(:identifier) { match['A-Za-z0-9'].repeat.as(:identifier) }
rule(:node) { identifier >> newline >> (indent >> identifier >> newline.maybe).repeat.as(:children) }
rule(:document) { node.repeat }
root :document
end
require 'ap'
require 'pp'
begin
input = DATA.read
puts '', '----- input ----------------------------------------------------------------------', ''
ap input
tree = IndentationSensitiveParser.new.parse(input)
puts '', '----- tree -----------------------------------------------------------------------', ''
ap tree
rescue IndentationSensitiveParser::ParseFailed => failure
puts '', '----- error ----------------------------------------------------------------------', ''
puts failure.cause.ascii_tree
end
__END__
user
name
age
recipe
name
foo
bar
e 'chiaro che ho bisogno di un dinamicamente c contatore che prevede 3 nodi di indentazione per abbinare un identificatore a livello di annidamento 3.
Come posso implementare un parser di sintassi sensibile all'indentazione utilizzando Parslet in questo modo? È possibile?
Non sono sicuro se questo è meglio fatto come parse/costruire fasi distinte. Praticamente qualsiasi combinazione di livelli di indentazione sarebbe valida e analizzata, quindi per me questo punta a un parser basato su linee molto semplice che cattura solo il livello di indentazione, quindi qualcosa che prende l'output del parser e costruisce la struttura nidificata. –