2015-01-05 15 views
7

Youtube offre due opzioni di ordinamento: i più recenti primi e i più commentati. Il "più nuovo prima" è abbastanza semplice che noi semplicemente ordiniamo i commenti in base alla loro data di pubblicazione. Ma i "Top comment" sembrano essere molto più complessi di un semplice "thumb up".Che cosa sono gli algoritmi di ordinamento dei sistemi di commenti di YouTube?

Youtube comment system

Dopo una breve ricerca, ho scoperto che l'ordine dei commenti è dipende da queste cose:

  • Numero di "pollice in su" s e "pollice giù" s
  • data di inserimento
  • numero di risposte da quel commento

Ma io non so come Lei tube usa queste informazioni per decidere l'ordine, ad esempio quali informazioni sono più importanti e cosa è meno importante.

C'è qualche articolo su questo argomento a cui posso fare riferimento?

Grazie!

+0

Questo è chiamato algoritmo di classifica. Anch'io sono interessato Non è facile vedere se gli ingegneri di YouTube non pubblicano il loro algoritmo. Questo è l'algoritmo di ranking di Reddit. Penso che sia più complicato di quanto pensiamo. http://amix.dk/blog/post/19588 Quindi forse anche a YouTube piace questo – hqt

risposta

12

Ho la risposta alla tua domanda. Dopo aver cercato su internet la risposta a questo, non ho mai trovato esattamente quello che stavo cercando. Così, io e i miei colleghi abbiamo deciso di sperimentare usando il sistema con i commenti di Youtube. Prima di tutto, abbiamo ordinato ciò che ritenevamo essere video popolari in una sezione, i video medi in un'altra e meno popolare nell'ultima. C'erano 200 video in ogni sezione, e dopo giorni di esami abbiamo iniziato a notare un pattern. Abbiamo scoperto che avevi ragione riguardo alle tre cose richieste, ma ci siamo anche tuffati un po 'più in profondità e abbiamo trovato una variabile aggiuntiva. Il sistema di commenti di Youtube dipende da QUATTRO cose: tempo in cui è stato pubblicato, come/non mi piace il rapporto di un commento, il numero di risposte e, che ci crediate o no, l'OMS lo ha pubblicato. Il rapporto medio come/non mi piace di ogni commento pubblico che tu abbia mai pubblicato si basa su di esso, come (quello che avevamo previsto) credono che quelli con bassi rapporti di tipo/non piace pubblicherebbero commenti a cui molte persone non piacciono o semplicemente non sono d'accordo. C'è un algoritmo ad esso, ed è molto più semplice di quanto si possa pensare. Fondamentalmente ci sono queste cose che abbiamo chiamato "module points", e ne ottieni una determinata basata su questi quattro fattori. In primo luogo, qui sono le cose che dovete sapere su conversione del punto di modulo con due dei fattori:

  • Per il rapporto come/antipatia sul commento, moltiplicare quel numero per dieci.

  • Per la quantità di risposte (NON del poster originale) che il commento ha, ci sono due punti modulo.

Questi sono i due fattori di base che indicano la quantità di punti modulo del commento. Ad esempio, se un commento aveva 27 Mi piace e 8 Non mi piace, il rapporto sarebbe 3.375. Moltiplicando per 10, avresti allora 33.75 punti modulo. Usando il prossimo fattore, quantità di risposte, diciamo che questo commento ha quattro risposte dirette ad esso. Moltiplicando 2 per 4, otteniamo otto. Questa è la parte in cui aggiungi otto ai punti del modulo cumulativo, fornendo un totale di 41.75 punti modulo.

Ma non ci siamo riusciti, è qui che diventa difficile.Utilizzando il rapporto medio Mi piace/Non mi piace dei commenti totali di una persona che hanno mai pubblicato pubblicamente, abbiamo trovato che la formula aggiunta ai punti del modulo cumulativo è questa:

(C = Variabile posizione commento; MP = Punti modulo; totale R = di persona come rapporto segnale/rumore antipatia)

C = MP (R/3) + (MP/10)

Fidati di me, abbiamo trascorrere giorni solo su questa parte, che era probabilmente il più frustrante. Anche se i tre e i dieci all'interno di questa equazione sembrano casuali e non necessari, finora tutti i commenti che abbiamo testato su questa equazione hanno superato il test, ma non hanno superato il test quando quelle due variabili sono state rimosse. Dopo aver eseguito questa equazione, ti dà un numero che abbiamo chiamato per essere la variabile di posizione.

Tuttavia, non abbiamo ancora finito, non abbiamo ancora parlato del tempo. In realtà sono rimasto piuttosto sorpreso dal fatto che questa parte non ha richiesto tutto il tempo che mi aspettavo, ma è stato sicuramente un dolore fare questa equazione ogni volta per ogni commento che abbiamo testato. All'inizio, durante il test, abbiamo capito che era il momento giusto per rompere la barriera se due commenti avessero uguali Variabili di posizione. In effetti, quasi l'ho definito un involucro nell'esperimento quando ciò è accaduto, ma dopo un'ulteriore ispezione, abbiamo scoperto che c'era ancora molto da fare. Abbiamo scoperto che alcuni dei commenti si sono superati l'un l'altro e che avevano la stessa variabile di posizione, ma i tempi sembravano casuali. Dopo alcuni giorni di ispezione, ecco dove arriva il risultato finale:

C'è ancora un'ALTRA equazione che dobbiamo trovare prima di applicare la quarta variabile. Usando un'altra equazione separata, ecco le nostre deduzioni algebriche: (X = variabile di tempo S = quanto tempo fa il video è stato pubblicato in minuti; A = quanto tempo fa il commento è stato pubblicato in minuti)

X = 1/3 (S/10 + A) x [valore assoluto di] (A - 3S)

Mi piacerebbe averlo inventato, ma sfortunatamente questo è quanto sia complicato il sistema. Ci sono ragioni matematiche dietro le altre variabili, ma sono troppo complesse da spiegare, probabilmente ci vorranno almeno tre paragrafi per spiegare. Abbiamo testato questa equazione su oltre 150 commenti, tutti verificati per essere veri.

Una volta trovato X, che è quello che abbiamo chiamato la fasatura variabile, tutto quello che dovete fare da qui è applicare a questa equazione:

(X = fasatura variabile; C = Posizionamento variabile)

N = X (C/4 + 1)

N è la risposta a tutti i tuoi problemi. Questa è l'equazione finale, la risposta finale. La semplice conclusione: maggiore è N, più alto è il commento. Un ringraziamento speciale ai miei colleghi: David Mattison, Josh Williams, Diego Mendieta, Steven Orsette e Kyle Shropshire. Non avrei mai potuto scoprire questo senza di loro e il lavoro che hanno messo in questo.

+0

Grazie per aver dedicato del tempo a questo, altamente apprezzato e rispettato il tuo lavoro qui. Anche se non sono sicuro di quanto sia accurato, ma ci proverò. Mi piacerebbe leggere un articolo su come avete escogitato queste formule complesse e il codice sorgente (se esiste) per testarlo sul sistema di commenti di Youtube, che sarebbe molto interessante. – TrungDQ

+0

@Cole Dixon, il fattore WHO che hai menzionato influisce sul risultato? Non riesco a vedere alcun fattore sull'OMS. –

+0

Il fattore WHO è R, il rapporto totale di somiglianza/antipatia della persona. –