Treść książki

Przejdź do opcji czytnikaPrzejdź do nawigacjiPrzejdź do informacjiPrzejdź do stopki
VIII
Wstęp
ichwjedenmodelglobalnywceludokonaniapredykcji.Torozwiązaniepozwalatakże
uchwycićprocesewolucjibadanegozjawiska.
Poczwarte,czasamizbiorydanychmogąbyćtakduże,żeniejestmożliweich
bezpośrednieużyciedobudowymodeludyskryminacyjnegolubregresyjnego,np.ze
względunawłasnościprogramówkomputerowychlubwielkośćpamięcikomputera.
Wtedynaturalnymrozwiązaniemjestdokonaniepodziałutakiegozbiorunamniejsze
podzbioryizbudowaniedlakażdegoznichosobnegomodelu.Następniemodelete
należypołączyćwceludokonaniapredykcji.
Popiąte,podejściewielomodelowemożnawykorzystaćtakżewtakimprzypadku,
gdyposiadanyzbiórdanychjestzbytmały,cogrozizbytdobrymdopasowaniempoje-
dynczegomodeludodanych.Możnawtedyzastosowaćtechnikilosowaniazezwraca-
niempoto,byutworzyćwielezbiorówobserwacjiidlanichzbudowaćindywidualne
modele,podlegającenastępniełączeniu.
Wreszcieposzóste,niektóreproblemywystępującewpraktycezbytzłożone,
abymożnabyłojerozwiązać,wykorzystującmodeletejsamejklasy,np.drzewaklasy-
fikacyjne.Dziejesiętaknaprzykładwtedy,gdygranicemiędzyklasamiwprzestrzeni
zmiennychbardzonieregularne.Możnawtedyzastosowaćmodeleinnejklasy,np.
siecineuronowelubmetodęwektorównośnych(SVM),anastępniepołączyćjewcelu
uzyskaniadokładnejpredykcji.
PierwsząpracąnatematłączeniamodelidyskryminacyjnychbyłartykułDasa-
rathy’egoiSheeli(1978),wktórymzaproponowanowykorzystaniedwóchróżnych
modelidopodziałuprzestrzenizmiennych,anastępniepołączenieichwyników.Jed-
nakwzrostzainteresowaniametodamiłączeniamodelirozpocząłsiępoopublikowaniu
pracyHansenaiSalamona(1990),wktórejdowiedlioni,żeagregacjakilkusieci
neuronowychpozwalauzyskaćznaczącąpoprawęjakościklasyfikacji.
Wjęzykupolskimmałefragmentypoświęconeagregacjimodelimożnaznaleźć
wksiążkachCichosza(2000)orazKoronackiegoiĆwika(2005).Jeżelizaśchodzi
oliteraturęwjęzykuangielskim,tojużwtrakcieprzygotowywanianiniejszejpracy
ukazałasięksiążkaKunchevej(2004),prezentującawynikijejbadańnadproble-
matyką.
Ogólnierzeczujmując,wpolskiejliteraturzestatystycznejbrakjestzwartejpracyna
tematmetodłączeniamodelidyskryminacyjnych,któraprezentowałabyróżnesposoby
agregacji,zawieraławynikianalizyichwłasnościorazprzykładyzastosowaniaznanych
procedur,takichjakbaggingczyboosting.
ZadaniemtejksiążkijestprzybliżenieCzytelnikowipodstawowychzagadnieńzwią-
zanychzłączeniemmodelidyskryminacyjnychiregresyjnych.Pomysłjejnapisania
zrodziłsięjużwtrakcieprzygotowywaniamojejpoprzedniejksiążki(Gatnar,2001),
poświęconejdrzewomklasyfikacyjnymiregresyjnym,wydanejprzezWydawnictwo
NaukowePWN.Tamjednakznalazłsiętylkomałyfragmentpoświęconymetodom
agregacjitejklasymodeli,któredawaływidocznąpoprawędokładnościklasyfikacji.
Niniejszapracaskładasięzsześciurozdziałów.Pierwszyznichpoświęconopre-
zentacjiogólnejpostacimodelidyskryminacyjnychiregresyjnych,sposobomszacowa-
niabłędupredykcjiorazjegodekompozycji.Przedstawionownimtakżezbiorydanych,
którewykorzystywanewprzykładachzamieszczonychwksiążce.