Treść książki

Przejdź do opcji czytnikaPrzejdź do nawigacjiPrzejdź do informacjiPrzejdź do stopki
8
AnnaGacek,AndrzejGajewski
Wceluporównaniaiklasyfikacjiobiektówróżnowymiarowych(np.aktywność
molowaistężenie)należydokonaćstandaryzacjidanych.Możnaposłużyćsięnią
równieżwtedy7gdywystępująjednocześniezmienneodużymimałymrzędzie
pomiaruwówczaszmniejszonezostanąróżnicepomiędzyklasyfikowanymi
obiektami.
Analizaskupieńopierasięnapojęciuodległościobiektówlubzmiennych
wprzestrzeniwielowymiarowej.Wzajemnepodobieństwoprzejawiająobiekty
znajdującesiębliskosiebie.Zatempodziałobiektównagrupy(skupiska)odbywa
sięnapodstawiestopniapodobieństwaobiektówlubzmiennych.Jeżeliprzestrzeń7
wjakiejdokonujemyanalizy7jestprzestrzeniądwu-lubtrójwymiarową7miarą
odległościtakichobiektówjestodległośćgeometrycznamiędzynimi.Jednak
wprocesiemodelowaniałączeniaobiektówodległości7jakieobliczamy7nie
musząbyćrzeczywiste.Doanalitykanależywybórodpowiedniejmiary7która
określiwzajemnepołożenieobiektów.Wśródznanychmiarobliczaniaodległości
obiektówmożnawyróżnić:odległośćeuklidesową7kwadratodległościeuklide-
sowej7odległośćManhattan7funkcjęwspółczynnikakorelacji7odległośćCzeby-
szewa7odległośćpotęgową.Opistychmetodmożnaznaleźćwwielupodręcz-
nikach7np.:[Brereton20037Grabiński19927Mazerski20007Walasiak2002].
Najczęściejwybieranymimiernikamiodległościjednakodległośćeuklidesowa
(3)orazkwadratodległościeuklidesowej(4).Metodadruganadajewiększąwagę
obiektom7którebardziejoddalone[Brereton2003]:
dxy
_
dxy
_
,
,
i
i
=
=
/
i
/
i
_
x
_
x
i
i
y
y
i
i
i
2
i
.
2
,
Wkolejnymetapieanalizy7gdyzdefiniowanezostanąodległościmiędzy
obiektamizapomocąwybranejmiaryodległości7należyutworzyćskupienia
(skupiska).Istniejekilkametodichtworzenia:metodanajbliższegosąsiada7
najdalszegosąsiada7środkówciężkości7średnichpołączeńorazalgorytmWarda
[Brereton20037Mazerski2000].Tutajjednakuwagęzwróćmynametodęnajbliż-
szegosąsiada7wktórejodległośćmiędzydwomaskupieniamijestokreślonaprzez
odległośćmiędzydwomanajbliższymiobiektaminależącymidoróżnychskupień.
Zasadatadeterminujeformowanieskupieńwciągi7wwynikuczegokońcowe
skupieniatworzą„łańcuchy”.
Prezentacjęinformacjizawierającejsięwmacierzyodległościprzedstawia
sięwpostacigraficznejzapomocądendrogramu(zob.rys.1).Dendrogramjest
diagramem7któryułatwiazaobserwowaniegrupobiektówiichpodobieństwalub
jegobraku.
(3)
(4)