Clustering
Il Clustering o analisi dei cluster (dal termine inglese cluster analysis introdotto da Robert Tryon nel 1939), o analisi dei gruppi, è un insieme di tecniche di analisi multivariata dei dati volte alla selezione e raggruppamento di elementi omogenei in un insieme di dati. Tutte le tecniche di clustering si basano sul concetto di distanza tra due elementi. Infatti la bontà delle analisi ottenute dagli algoritmi di clustering dipende molto dalla scelta della metrica, e quindi da come è... —
| approfondisci »
Clustering gerarchico
In statistica e apprendimento automatico, il clustering gerarchico è un approccio di clustering che mira a costruire una gerarchia di cluster. Le strategie per il clustering gerarchico sono tipicamente di due tipi:
• Agglomerativo: si tratta di un approccio "bottom up" (dal basso verso l'alto) in cui si parte dall'inserimento di ciascun elemento in un cluster differente e si procede quindi all'accorpamento graduale di cluster a due a due.
• Divisivo: si tratta di un approccio "top down" (dall... —
| approfondisci »
Computer cluster
linguaggi C, Fortran, Python, OCaml, e molti altri linguaggi di programmazione.
Il mondo GNU/Linux supporta vari tipi di software per il clustering, come: GNU/Linux è attualmente il sistema più utilizzato per il clustering: secondo Top500 nel 2006 è stato il sistema più usato in assoluto.
La piattaforma Microsoft Windows Compute Cluster Server 2003 basata su Windows Server 2003 Standard x64 Edition fornisce elementi per il calcolo ad alte prestazioni, come "Job Scheduler", le librerie MSMPI ed altri... —
| approfondisci »
Dendrogramma
Nelle tecniche di Clustering, il dendrogramma viene utilizzato per fornire una rappresentazione grafica del processo di raggruppamento delle istanze (o unità statistiche, o records, o elementi dell'insieme), che esprime:
• nell'asse delle ascisse, la distanza logica dei clusters secondo la metrica definita
• nell'asse delle ordinate, il livello gerarchico di aggregazione (valori interi positivi)
La scelta del livello gerarchico (del valore dell'asse Y) definisce la partizione... —
| approfondisci »
Segmentazione di immagini
rappresentazione che può essere descritta da un albero i cui nodi hanno quattro (o comunque il numero di sottoimmagini che vengono ottenute suddividendo) figli ciascuno. Un problema che si pone a questo punto con la tecnica di spplit è come unire le regioni adiacenti ed omogenee che risultano distinte :per tale motivazione ad ogni iterazione è seguito un merging; proceduralmente, ciò significa che date due regioni Ri e Rj, se P(Ri U Rj) = TRUE esse vengono fuse.
Clustering
Una procedura più elaborata per... —
| approfondisci »
Dbscan
Il DBSCAN (Density-Based Spatial Clustering of Applications with Noise) è un metodo di clustering proposto nel 1996, basato sulla densità; esso connette regioni di punti con densità dei medesimi sufficientemente alta.
Per ogni oggetto, saranno trovati i vicini che ricadono in un raggio dato come parametro in ingresso; se il numero di tali vicini è superiore ad un fattore di soglia (anch'esso fornito in input all'algoritmo), allora tali punti faranno parte del medesimo cluster di quello dell... —
| approfondisci »
IBM Scalable POWERparallel
IBM Scalable POWERparallel o SP è una piattaforma di supercomputer creata da IBM.
I nodi sono basati su RS/6000 gestiti dal software di clustering PSSP scritto principalmente in Perl.
Tra le tecnologie sviluppate per il progetto si segnala l'High Performance Switch (HPS) per la comunicazione tra nodi.
Collegamenti esterni
... —
| approfondisci »
K-means
L'algoritmo K-Means è un algoritmo di clustering che permette di suddividere gruppi di oggetti in K partizioni sulla base dei loro attributi. È una variante dell'Algoritmo di aspettazione-massimizzazione il cui obiettivo è determinare i K gruppi di dati generati da distribuzioni gaussiane. Si assume che gli attributi degli oggetti possano essere rappresentati come vettori, e che quindi formino uno spazio vettoriale.
Descrizione generale
L'obiettivo che l'algoritmo si prepone è di minimizzare... —
| approfondisci »
Taxon
In biologia, un taxon (plurale taxa, dal greco ταξις, taxis, "ordinamento") o unità tassonomica, è un raggruppamento di organismi reali, distinguibili morfologicamente e geneticamente da altri e rico... —
| approfondisci »
K-medoids
K-medoids è il nome di un algoritmo di clustering correlato all'algoritmo K-means. Prevede in input un insieme di n oggetti e un numero k che determina quanti cluster si vogliono in output.
Entrambi gli algoritmi sono partizionali (suddividendo il dataset in gruppi) ed entrambi cercano di minimizzare l'errore quadratico medio, la distanza tra punti di un cluster e il punto designato per esserne il centro. In K-means il punto è "artificiale" — è la pura media di tutti i punti nel cluster. Nel K... —
| approfondisci »
Universo in accelerazione
. Inoltre l'evidenza di un universo in espansione accelerata è stata corroborata da altre misure indipendenti come quelle basate sul clustering di galassie e sulla osservazione della anisotropia della radiazione cosmica di fondo.
Implicazioni
L'Universo accelerante implica che la velocità a cui una galassia si allontana dalle altre aumenta nel tempo. Se l'accelerazione dovesse continuare le galassie si allontaneranno le une dalle altre in modo tale che il loro spostamento verso il rosso sarà così... —
| approfondisci »
