Dato questo input di esempio:Calcolo percentuali in numero arbitrario di colonne
ID Sample1 Sample2 Sample3 One 10 0 5 Two 3 6 8 Three 3 4 7
I necessari per produrre questo output utilizzando AWK:
ID Sample1 Sample2 Sample3 One 62.50 0.00 25.00 Two 18.75 60.00 40.00 Three 18.75 40.00 35.00
Così ho risolto:
function percent(value, total) {
return sprintf("%.2f", 100 * value/total)
}
{
label[NR] = $1
for (i = 2; i <= NF; ++i) {
sum[i] += col[i][NR] = $i
}
}
END {
title = label[1]
for (i = 2; i <= length(col) + 1; ++i) {
title = title "\t" col[i][1]
}
print title
for (j = 2; j <= NR; ++j) {
line = label[j]
for (i = 2; i <= length(col) + 1; ++i) {
line = line "\t" percent(col[i][j], sum[i])
}
print line
}
}
Funziona correttamente in GNU AWK (awk
in Linux, gawk
in BSD), ma non in BSD AWK, dove ottengo questo errore:
$ awk -f script.awk sample.txt awk: syntax error at source line 7 source file script.awk context is sum[i] += >>> col[i][ <<< awk: illegal statement at source line 7 source file script.awk awk: illegal statement at source line 7 source file script.awk
sembra che il problema è con gli array multidimensionali. Mi piacerebbe far funzionare questo script anche in BSD AWK, quindi è più portatile.
C'è un modo per cambiare questo per farlo funzionare in AWD BSD?
Risposta semplice - provare nawk. Dovrebbe essere parte dell'installazione di BSD. Alcune versioni di awk sono veramente vecchie. –