Registro Lezioni - Lab Info Avanzata - Biotec 2008/2009

In questa pagina è riportato un registro degli argomenti affrontati a lezione. In corrispondenza di ogni lezione è inserito il link ai relativi file di esercitazione (excel e R) prodotti a lezione. L'elenco completo dei file excel e R è disponibile a questo link: elenco file esercitazioni.

 

Introduzione del corso basato sull’analisi statistica dei dati con l’uso del foglio elettronico (excel in particolare).

Ripasso di alcuni strumenti di base del foglio di calcolo: riferimenti relativi e assoluti, costruzione di grafici a dispersione, linea di tendenza, equazione della linea di tendenza. Generazione di numeri casuali per la simulazione dei dati reali. Simulazione di un andamento lineare fra due variabili con l’uso della funzione casuale.

Ripasso della costruzione di istogrammi: scelta e definizione delle classi, determinazione delle frequenze. Introduzione della funzione conta.se.

 

 

Approfondimento sulla funzione conta.se e riferimenti a celle nel campo criterio. Uso di funzioni logiche nei criteri della funzione conta.se e difficoltà nell’uso specifico per la determinazione delle frequenze. Determinazione delle frequenze con la combinazione di due funzioni conta.se.

Determinazione delle frequenze con l’uso della funzione matriciale frequenza.

Cenni sulle distribuzioni e verifica della distribuzione uniforme dei numeri casuali generati dal foglio di calcolo.

Manipolazione della distribuzione standard dei numeri casuali (da 0 a 1) per la costruzione di una distribuzione piatta fra due estremi scelti.

Introduzione alla generazioni di numeri casuali distribuiti secondo una distribuzione scelta, esempio di una distribuzione triangolare con la tecnica MonteCarlo della doppia estrazione.

 

 

Generazione di un campione di numeri random distribuiti secondo una distribuzione triangolare con la tecnica della doppia estrazione. Confronto del valore medio calcolato sui dati con la media pesata determinata da corrispondenti istogrammi con numero di classi diverso. Osservazioni sulla scelta del numero di classi. Determinazione di mediana e moda sul precedente campione. Osservazioni sulla determinazione della mediana dei numeri non approssimati, numeri approssimati e campione rappresentato in un istogramma.

 

 

Generazione con la tecnica della doppia estrazione di un campione di numeri distribuiti normalmente. Determinazione di media e deviazione standard dal campione. Rappresentazione del campione in un istogramma. Ricerca di diversi metodi per sovrapporre ad un istogramma la distribuzione corrispondente: tabella di dati corrispondenti alla funzione, introduzione della definizione di variabili in excel e uso delle istruzioni di ricorrenza. 

  • 12/05/2009

Cenni sull’uso delle variabili in excel. Introduzione al software di analisi dati R-Statistics.

 

  • 13/05/2009  Scarica i file .R: ParteI, ParteII e ParteIII   per  visualizzare i file .R aprirli con blocco note, wordpad o qualsiasi altro editor di testo. Nel file parteI sono riportate le istruzioni per eseguire i file .R in R

Uso del software R con semplici esempi.

Definizione di una costante e di un vettore. Somma, media, varianza e deviazione standard degli elementi di un vettore.

Rappresentazione grafica di un vettore di dati con l’istogramma delle frequenze e delle densità. Estrazione del vettore frequenze e del vettore densità da un istogramma.

Generazione di un campione di dati distribuiti secondo una gaussiana con media e sigma definiti dall’utente.

Rappresentazione grafica dei dati con l’istogramma e normalizzazione a 1. Calcolo di media e deviazione standard e confronto con i valori di generazione.

Costruzione delle funzione gaussiana con i valori misurati di media e sigma. Rappresentazione grafica della funzione. Calcolo dell’integrale della funzione ed estrazione del risultato.

Sovrapposizione dell’istogramma dai dati normalizzato e della funzione gaussiana e verifica qualitativa del buon adattamento fra dati e funzione.

 

  • 19/05/2009  Scarica i file .R e i file di dati usati negli esempi dalla cartella Lezione R del 19/05/2009, per  visualizzare i file .R aprirli con blocco note, wordpad o qualsiasi altro editor di testo. Nel file parteI sono riportate le istruzioni per eseguire i file .R in R

 Esercitazioni con il software R.

Lettura di dati da un file esterno con variabili correlate ed inserimento un data frame. Uso delle opzioni per la definizione dei nomi delle variabili: nomi assegnati da R, nomi definiti dall’utente, nomi definiti nell’header del file di dati. Uso delle opzioni di lettura nel caso di file di dati con campi vuoti.

Analisi delle correlazioni fra le variabili e selezione con tagli sulle variabili stesse. Selezione di una variabile che soddisfi ad un taglio su sé stessa. Selezione di una variabile che soddisfi ad un taglio su una delle variabili correlate. 

 

  • 20/05/2009  Scarica i file .R e i file di dati usati negli esempi dalla cartella Lezione R del 20/05/2009, per  visualizzare i file .R aprirli con blocco note, wordpad o qualsiasi altro editor di testo. Nel file parteI sono riportate le istruzioni per eseguire i file .R in R

 Esercitazioni con il software R.

Modifica dei dati contenuti in una o più variabile di un data frame letto da file. Sostituzione del vettore di una variabile di un data frame con un nuovo vettore.

Esempio di costruzione di un data frame da R.

 

  • 26/05/2009  Scarica i file .R dalla cartella Lezione R del 26/05/2009, per  visualizzare i file .R aprirli con blocco note, wordpad o qualsiasi altro editor di testo. Nel file parteI sono riportate le istruzioni per eseguire i file .R in R

 Esercitazioni con il software R.

Strumenti di regressione lineare e non lineare.

Fit di due variabili con dipendenza lineare, diversi strumenti di fit, estrazione dei parametri fittati e confronto con i parametri simulati. Estrazione degli errori sui parametri dalla matrice di covarianza.

Fit di due variabili con dipendenza non lineare (esempio di esponenziale decrescente), estrazione dei parametri e degli errori.

Fit di una distribuzione di dati, estrazione dei parametri e degli errori e interpretazione delle comunicazioni dell’algoritmo di fit.

 

  • 03/06/2009  Scarica il file pdf degli appunti della lezione e i file .R dalla cartella Lezione R del 03/06/2009, per  visualizzare i file .R aprirli con blocco note, wordpad o qualsiasi altro editor di testo. Nel file parteI sono riportate le istruzioni per eseguire i file .R in R

 Esercitazioni con il software R.

Fit e test del chi quadrato per due variabili (x,y) correlate. Caso generale in cui y è misurata con un errore. Alcune considerazioni in cui non si conosca l'errore su y.

Uso degli strumenti di R per l'estrazione del chi quadro dal fit e determinazione della probabilità di chi quadro. Calcolo del chiquadro con la definizione e confronto con i risultati del fit.

Fit e test del chi quadrato per la distribuzione di una variabile x ottenuta da una misura statistica. Uso degli strumenti di R per il test del chi quadro, calcolo con la definizione  e confronto. Determinazione della probabilità di chi quadro.

Conclusione del corso con le indicazioni per gli esami.