A partire dalla dichiarazione di sintesi di Cairnarvon:
"Sembra che il motivo principale per PyPI ha bisogno di specchi è perché ha loro".
avrei modificare leggermente questo:
Potrebbe essere più il modo PyPI effettivamente funziona e quindi ha da ribaltare, che potrebbe contribuire un ulteriore bit (o due :-) al reale traffico.
Al momento penso che DEVI interagire con l'indice principale per sapere cosa aggiornare nel tuo repository. Lo stato non è semplicemente accessibile tramite timestamp su alcune gerarchie di cartelle accessibili pubblicamente.Quindi, la cosa brutta è che rsync è fuori dall'equazione. La cosa buona è che POTREI parlare con l'indice attraverso le interfacce JSON, OAuth, XML-RPC o HTTP.
Per XML-RPC:
$> python
>>> import xmlrpclib
>>> import pprint
>>> client = xmlrpclib.ServerProxy('http://pypi.python.org/pypi')
>>> client.package_releases('PartitionSets')
['0.1.1']
Per JSON ad es .:
$> curl https://pypi.python.org/pypi/PartitionSets/0.1.1/json
Se ci sono circa. 30.000 pacchetti ospitati [1] con alcuni scaricati da 50.000 a 300.000 volte alla settimana [2] (come distribuire, pip, richieste, paramiko, lxml, boto, paramike, redis e altri) avete davvero bisogno di specchi almeno da una prospettiva di accessibilità. Immagina cosa succede a un utente quando pip install NeedThisPackage
non riesce: Attendi? Anche i mirror PyPI aziendali sono abbastanza comuni come proxy per reti altrimenti non rintracciabili. Infine, non dimenticare il meraviglioso controllo multi versione abilitato tramite virtualenv e amici. Questi sono tutti usi legittimi e potenzialmente meravigliosi IMO di pacchetti ...
Alla fine, non si sa mai quale agente fa veramente con un pacchetto scaricato: gli utenti N lo usano davvero o lo sovrascrivono appena la volta successiva. .. e dopo tutto, gli autori del pacchetto IMHO dovrebbero preoccuparsi di più per numero e la natura di usi, rispetto al puro numero di utenti potenziali ;-)
Refs: I numeri sono da guestimated https://pypi.python.org/pypi (29303 pacchetti) e http://pypi-ranking.info/week (per il nu mbers, richiesto il 23/03/2013).
congratulazioni! non vedo questo comportamento per i miei pacchetti ... vedo alcuni download di bot, ma non così tanti (forse 10-100 su una nuova versione?). forse hai davvero utenti ?! powerlaws sono piuttosto alla moda ... –
Non possono essere così alla moda! Ho anche caricato [un altro] (http://pypi.python.org/pypi/avalanchetoolbox), un pacchetto di analisi scientifica MOLTO specializzato (avalanchetoolbox) allo stesso tempo, che ha un comportamento molto simile (> 1.000 download in 1.5 mesi in tutte le versioni). Non ci sono 1.000 persone al mondo che troverebbero quel pacchetto interessante, quindi qualcosa deve essere sbagliato. Come avalanchetoolbox fa affidamento su powerlaw, forse una singola persona realmente interessata al pacchetto ha impostato un cron job per controllare automaticamente e scaricare gli aggiornamenti, e il lavoro è bacato? – jeffalstott
Scusa, tardi per il tè, ma lo stackoverflow è un po 'senza tempo, vero? Ho notato che PyPI offre un binario .exe di Windows e solo il formato di pacchetto tar.gz come formato di packaging sorgente per il tuo pacchetto powerlaw. Se invece offri .zip, .tar.bz2 e .tar.gz (tutti come formati sorgente), potresti ottenere * qualche * suggerimento sottraendo un po '. ** Ipotesi **: l'utente di Windows accetta .zip. La maggior parte dei download di numeri uguali .tar.gz e .tar.bz2 potrebbe derivare dal mirroring. Ha senso? – Dilettant