12

Attualmente sto formando piccoli set di dati del logo simili a Flickrlogos-32 con CNN profonde. Per la formazione di reti più grandi ho bisogno di più set di dati, quindi utilizzando l'aumento. Il meglio che sto facendo in questo momento sta usando le trasformazioni affini (normalizzazione normale, centro perpendicolare, rotazione, spostamento in altezza della larghezza, vibrazione verticale orizzontale). Ma per le reti più grandi ho bisogno di più aumenti. Ho provato a cercare su forum di kaggle's data science bowl nazionale, ma non ho potuto ottenere molto aiuto. C'è il codice per alcuni metodi dati here ma non sono sicuro di ciò che potrebbe essere utile. Quali sono alcune altre (o migliori) tecniche di incremento dei dati di immagine che potrebbero essere applicate a questo tipo di set di dati (o in qualsiasi immagine generale) oltre alle trasformazioni affini?Tecniche di incremento dei dati per set di dati di piccole immagini?

risposta

12

Un buon riassunto può essere trovato here, sezione 1 su Data Augmentation: in modo cioè ribalta, colture casuali e colore jittering e anche il rumore illuminazione:

Krizhevsky et al. proposto fantasia PCA quando si allena il famoso Alex-Net nel 2012. Fancy PCA altera le intensità dei canali RGB nelle immagini di allenamento.

In alternativa puoi anche dare un'occhiata alla sfida dello Zoo di Kaggle Galaxy: i vincitori hanno scritto un very detailed blog post. Copre lo stesso tipo di tecniche:

  • rotazione,
  • definizione,
  • zoom,
  • lanci,
  • colore perturbazione.

Come indicato, lo fanno anche "in tempo reale, cioè durante l'allenamento".

Ad esempio, ecco un pratico Torchimplementation da Facebook (per la formazione ResNet).

2

Ho raccolto un paio di tecniche di aumento in my masters thesis, page 80. Esso comprende:

  • Zoom,
  • Crop
  • Flip (orizzontale/verticale)
  • rotazione
  • Scaling
  • tosatura
  • spostamenti di canale (RGB, HSV)
  • contrasto
  • rumore,
  • vignettatura