Oggi stavo cercando un pacchetto di statistiche open source e ho trovato R, una statistica GPLed e una suite di analisi dei dati. Dolce!
R fornisce un'ampia varietà di tecniche statistiche (modellazione lineare e non lineare, test statistici classici, analisi di serie temporali, classificazione, clustering, ...) e tecniche grafiche ed è altamente estensibile. Il linguaggio S è spesso il veicolo di scelta per la ricerca in metodologia statistica e R fornisce una via Open Source alla partecipazione a tale attività.
Uno dei punti di forza di R è la facilità con cui è possibile produrre trame di qualità di pubblicazione ben progettate, compresi simboli matematici e formule dove necessario. È stata prestata grande attenzione alle impostazioni predefinite per le scelte di progettazione minori nella grafica, ma l'utente mantiene il controllo completo.
Quindi ho lavorato con questo per l'ultima mezz'ora ed è davvero un pacchetto entusiasmante, specialmente se sei un programmatore o unix geek. Si interfaccia con R attraverso un'interfaccia di programmazione a riga di comando, eseguendo semplici istruzioni, impostando variabili e definendo le funzioni. È simile all'emissione di comandi su un prompt di Unix, eccetto che stai lavorando con set di dati anziché descrittori di file.
La cosa interessante è la robusta capacità del set di funzioni standard. Vuoi leggere un set di dati da una tabella delimitata da tabulazioni che hai trovato su internet? Controllalo:
# Leggi una tabella in da un URL (tabella delimitata da tabulazioni con intestazioni di riga) Mydata <- read.table (http://someserver.com/table.txt ', header = TRUE)
# Visualizza il riepilogo (media, mediana, min, max, ecc.) Per ogni riepilogo di colonna (dati personali)
# Ottieni la deviazione standard per i valori nella colonna "foo" attach (Mydata) sd (foo)
Imparare il set di comandi è un po 'scoraggiante all'inizio, ma la console fa anche il completamento delle schede. Se non sai cosa fa una funzione, metti un punto interrogativo prima di essa. Ad esempio, "? Sd" richiamerà rapidamente l'aiuto per la funzione di deviazione standard.
Ho solo graffiato la superficie, ma ci sono dei collegamenti sottostanti ad alcune guide per principianti R che dovrebbero aiutarti a iniziare. Qualcuno là fuori ha più familiarità con il pacchetto? Si prega di condividere eventuali link e suggerimenti utili nei commenti.
Il progetto R per il calcolo statistico - Link Un'introduzione al calcolo statistico in R - Link Produzione di grafici semplici con R - Link