unix tr find e replace

Questo è il comando che sto usando su una pagina web standard. Vedo da online.unix tr find e replace

tr '<' '\n<' < index.html

tuttavia dandomi a capo, ma non aggiungendo la carota nuovamente. ad es.

echo "<hello><world>" | tr '<' '\n<'

rendimenti

(blank line which is fine) 
hello> 
world>

invece di

(blank line or not) 
<hello> 
<world>

Grazie

fonte

2011-12-01 Kamran224

Questo perché tr solo fa carattere per carattere la sostituzione (o cancellazione).

Prova sed invece.

echo '<hello><world>' | sed -e 's/</\n&/g'

Oppure awk.

echo '<hello><world>' | awk '{gsub(/</,"\n<",$0)}1'

Or perl.

echo '<hello><world>' | perl -pe 's/</\n</g'

oppure ruby.

echo '<hello><world>' | ruby -pe '$_.gsub!(/</,"\n<")'

oppure python.

echo '<hello><world>' \ 
| python -c 'for l in __import__("fileinput").input():print l.replace("<","\n<")'

fonte

2011-12-01 23:23:46 ephemient

ho provato ma ho n n .Non so quale sia il carattere newline sed – Kamran224

@ Kamran224 Funziona per me, ma prova: echo -e ' ' | sed -e 's/

@ Kamran224 '\ n' è un'estensione GNU sed. Su quale sistema stai? – ephemient

Funziona per voi?

awk -F"><" -v OFS=">\n<" '{print $1,$2}' 

[jaypal:~/Temp] echo "<hello><world>" | awk -F"><" -v OFS=">\n<" '{$1=$1}1'; 
<hello> 
<world>

si può mettere un regex// (linee che si vuole che questo accada per) davanti dell'azione awk{}.

fonte

2011-12-01 23:38:56

''{$ 1 = $ 1} 1'' è più breve e funzionerà se c'è più di'><'su una riga. – ephemient

Grazie a @ephemient Sono d'accordo, ho aggiornato la mia risposta. –

Questo sostituirà meno dei caratteri '<' che nella domanda. –

Se avete GNU grep, questo può funzionare per voi:

grep -Po '<.*?>[^<]*' index.html

che dovrebbe passare attraverso tutto il codice HTML, ma ogni tag dovrebbe cominciare all'inizio della riga con eventuale testo non tag seguente sulla stessa linea.

Se si desidera altro che tag:

grep -Po '<.*?>' index.html

Si deve sapere, tuttavia, che è not a good idea per analizzare HTML con regex.

fonte

2011-12-04 06:30:31

L'ordine di dove si inserisce la nuova linea è importante. Inoltre puoi sfuggire allo "<".

tr '\/<' '\/<\n' < index.html

`tr '<' '<\n' < index.html` works as well.

fonte

2013-10-03 21:27:43 felix747

risposta

Problemi correlati