Podstaw
Konstrukcji
Maszyn
Wydział
Mechaniczny
Technologiczny
MetodySztucznej
Politechnika
l¡ska
Inteligencji
KierunekstudiówWT,ZiIP,semestr4
Prowadz¡cyprzedmiot
drin».AnnaTimofiejczuk
Rokakademicki2002/03
Instrukcjado¢wicze«tablicowych
wiczenie3
Temat
Odkrywaniewiedzywbazachdanych.
Opracował:mgrin».D.Wachla
ul.Konarskiego18a
44-100Gliwice
tel.2371467
fax.2371360
http://kpkm.mt.polsl.gliwice.pl
W0PP07P00D45-03
Z0PP07P00D45-03
Gliwice2003-02-01 -1/7-
1.Cel¢wiczenia
Celem¢wiczeniajestnabycieumiej¦tno±ciposługiwaniasi¦heurystykamipozwalaj¡cymina
odkrywanieprostychprawfizycznychjaknp.równaniegazudoskonałego,IIIprawoKeplera,
prawoCoulombaitd.
2.Wprowadzenieteoretyczne
Kilkawiekówtemu,tacybadaczejakKepleriGalileuszzapocz¡tkowaliprocesodkrywaniapraw
opisuj¡cychzachowaniesi¦otaczaj¡cegoich±wiata.Wswoichodkryciachstosowaliprostere-
gułyheurystyczne,pozwalaj¡cenaopisywaniezwi¡zkówpomi¦dzydanymi,któregromadzili
wtrakciedokonywanychobserwacji.Id¡cich±ladem,napocz¡tkulatosiemdziesi¡tychubie-
głegostulecia,zostałopracowanysystemodkry¢naukowych
BACON
[3,4],któregocelem
jest„automatyczne”odkrywaniepraw(zwi¡zków)pomi¦dzydostarczonymidanymi.Podobnie
jakwspomnienibadacze,tak»eiwsystemie
BACON
zawartotesameheurystki,któremo»na
przedstawi¢wnast¦puj¡cysposób[1,3]:
1.je±lizmienna
y
mawarto±¢
v
dlaodpowiedniodu»ejliczbyprzykładówtoprzyjmij,»e
y
mastał¡warto±¢
v
,
2.je±lizmienne
x
i
y
s¡liniowozale»nezpochyleniem
a
iprzesuni¦ciem
b
,czyli
y
=
ax
+
b
dlaodpowiedniodu»ejliczbyprzykładówtoprzyjmij,»etenzwi¡zekzachodzizawsze,
3.je±li
y
zmniejszasi¦przyzwi¦kszeniusi¦
x
oraz
x
i
y
nies¡zale»neliniowo,toutwórz
now¡zmienn¡
t
=
xy
,
4.je±li
y
zwi¦kszasi¦przyzwi¦kszaniu
x
oraz
x
i
y
nies¡zale»neliniowo,toutwórznow¡
zmienn¡
t
=
x/y
.
Chocia»przedstawionepowy»ejheurystykis¡bardzoproste,towwieluwypadkachichzasto-
sowaniezako«czysi¦niepowodzeniem,gdy[1]:
•
odkrywanyjestzwi¡zekwielomianowytakijaknp.
y
=
ax
2
+
b
,
•
x
i
y
nies¡monotoniczne,
•
danedlaktórychodkrywanejestrównanies¡cz¦±ciowoniepoprawne.
Wpływostatniegoprzypadkumo»nacz¦±ciowozminimalizowa¢wtrakciesprawdzeniastałej
warto±cizmiennejlubjejliniowejzale»no±ciodinnejzmiennej,przyjmuj¡c,»eposzukiwana
zale»no±¢mo»eby¢w„przybli»eniu”stałalubliniowa.Warto±cizmiennejmo»nauzna¢(w
„przybli»eniu”)zastałegdyichodchyleniestandardowejestdostateczniemałe.Dladowolnej
zmiennej
v
odchyleniestandarowemo»naobliczy¢nast¦puj¡co:
v
=
v
u
u
t
1
N
N
X
(
v
i
−
¯
v
)
2
(1)
i
=1
W0PP07P00D45-03
Z0PP07P00D45-03
Gliwice2003-02-01 -2/7-
gdzie
¯
v
jest±redni¡warto±ci¡
v
,obliczan¡nast¦puj¡co:
¯
v
=
1
N
N
X
v
i
(2)
i
=1
Je»eli
v
0
,tozmienna
v
mastał¡warto±¢równ¡
¯
v
wrozwa»anymzbiorzewarto±ci.W
przypadkuposzukiwaniazwi¡zkuliniowegodladwóchzmiennych
v
1
i
v
2
wyznaczasi¦ich
współczynnikkorelacji:
k
v
1
v
2
=
P
N
i
=1
(
v
1
i
−
¯
v
1
)(
v
2
i
−
¯
v
2
)
q
P
N
i
=1
(
v
1
i
−
¯
v
1
)
2
P
N
i
=1
(
v
2
i
−
¯
v
2
)
2
(3)
Je»eliwyznaczonywspółczynnikkorelacjimawarto±¢blisk¡
−
1
lub
1
,toparametry
a
i
b
zale»no±ci
v
1
av
2
+
b
mo»naoszacowa¢stosuj¡cmetodyregresjiliniowej.
2.1.Przykład
Abyzrozumie¢istot¦zastosowaniapowy»szychheurystykwdokonywaniuodkry¢,prze±ledzi-
myprocesodkrywaniarównaniaopisuj¡cegozale»no±¢pomi¦dzypr¦dko±ci¡rozchodzeniasi¦
d¹wi¦ku
V
wdanymo±rodkuatemperatur¡
T
tegoo±rodka.Potrzebnedanezamieszczono
w(Tab.1).
Tab.1:Danedoodkrywaniarównaniaopisuj¡cegozwi¡zekpr¦dko±cirozchodzeniasi¦d¹wi¦ku
V
wo±rodkuatemperatur¡o±rodka
T
.
T V
250316
.
75
273331
.
00
320358
.
36
330363
.
92
1.Pocz¡tkowomamydwiezmienne
{
T,V
}
(Tab.1).Mo»nazauwa»y¢,»e»adnaztych
zmiennychniemastałejwarto±ci.Wzwi¡zkuztymtworzymynowezmienne.
(a)Dlaparyzmiennych
h
T,V
i
(
T
–zmiennaniezale»na,
V
–zmiennazale»na)war-
to±ci
V
rosn¡przywzro±ciewarto±ci
T
.Wzwi¡zkuztymfaktemstosujemy4
heurystyk¦itworzymynow¡zmienn¡
x
1
odefinicji
x
1
=
T
V
orazobliczamyjej
warto±ci.Obliczonewarto±cizmiennej
x
1
dopisujemydotabeli(Tab.2)jakonow¡
kolumn¦,powi¦kszaj¡ctymsamymzbiórrozpatrywanychzmiennych.
(b)Dlaparyzmiennych
h
V,T
i
(
V
–zmiennaniezale»na,
T
–zmiennazale»na)warto±ci
T
rosn¡przywzro±ciewarto±ci
V
.Wzwi¡zkuztymfaktemstosujemy4heurystyk¦,
tworzymyzmienn¡
x
2
odefinicji
x
2
=
V
T
iobliczamyjejwarto±ci.Obliczonewarto±ci
zmiennej
x
2
dopisujemydotabeli(Tab.3)
W0PP07P00D45-03
Z0PP07P00D45-03
Gliwice2003-02-01 -3/7-
Tab.2:
T V x
1
250316
.
750
.
78927
273331
.
000
.
82477
320358
.
360
.
89295
330363
.
920
.
90680
Tab.3:
T V x
1
x
2
250316
.
750
.
789271
.
2670
273331
.
000
.
824771
.
2125
320358
.
360
.
892951
.
1199
330363
.
920
.
906801
.
1028
2.Wwynikupowy»szychdziała«otrzymujemynast¦puj¡cyzbiórzmiennych
{
T,V,x
1
,x
2
}
(Tab.3).adnazezmiennychwtymzbiorzeniejeststała.Wzwi¡zkuztymtworzymy
nowezmienne.
(a)Dlaparyzmiennych
h
T,x
1
i
(
T
–zmiennaniezale»na,
x
1
–zmiennazale»na)
warto±ci
x
1
rosn¡przywzro±ciewarto±ci
T
coprowadzidoutworzeniazmiennejo
definicji
T
x
1
=
T
·
V
T
odpowiadaj¡cejpocz¡tkowejzmiennej
V
,któr¡wzwi¡zkuztym
mo»emypomin¡¢.
(b)Dlaparyzmiennych
h
x
1
,T
i
(
x
1
–zmiennaniezale»na,
T
–zmiennazale»na)
warto±ci
T
rosn¡przywzro±ciewarto±ci
x
1
.Wzwi¡zkuztymstosujemyheurystyk¦
nr.4itworzymyzmienn¡
x
3
=
x
1
T
=
T
V
·
T
=
1
T
.Obliczonewarto±cizmiennej
x
3
dopisujemydo(Tab.4).
Tab.4:
T V x
1
x
2
x
3
250316
.
750
.
789271
.
26700
.
0031571
273331
.
000
.
824771
.
21250
.
0030211
320358
.
360
.
892951
.
11990
.
0027905
330363
.
920
.
906801
.
10280
.
0027479
(c)Dlaparyzmiennych
h
V,x
1
i
(
V
–zmiennaniezale»na,
x
1
–zmiennazale»na)
warto±ci
x
1
rosn¡przywzro±ciewarto±ci
V
.Stosujemyheurystyk¦nr.4itworzymy
W0PP07P00D45-03
Z0PP07P00D45-03
Gliwice2003-02-01 -4/7-
zmienn¡odefinicji
x
4
=
V
x
1
=
V
2
T
.Obliczamywarto±cizmiennejtejzmienneji
Tab.5:
T V x
1
x
2
x
3
x
4
250316
.
750
.
789271
.
26700
.
0031571401
.
32
273331
.
000
.
824771
.
21250
.
0030211401
.
32
320358
.
360
.
892951
.
11990
.
0027905401
.
32
330363
.
920
.
906801
.
10280
.
0027479401
.
32
(d)Dlaparyzmiennych
h
x
1
,V
i
(
x
1
–zmiennaniezale»na,
V
–zmiennazale»na)
warto±ci
V
rosn¡przywzro±ciewarto±ci
x
1
.Wzwi¡zkuztymstosujemyostatni¡
heurystyk¦itworzymyzmienn¡odefinicji
x
5
=
x
1
V
=
T
V
2
.Nast¦pnieobliczamy
warto±cizmiennej
x
5
iumieszczamyjew(Tab.6)jakonow¡kolumn¦.
Tab.6:
T V x
1
x
2
x
3
x
4
x
5
250316
.
750
.
789271
.
26700
.
0031571401
.
320
.
0024918
273331
.
000
.
824771
.
21250
.
0030211401
.
320
.
0024918
320358
.
360
.
892951
.
11990
.
0027905401
.
320
.
0024918
330363
.
920
.
906801
.
10280
.
0027479401
.
320
.
0024918
(e)Dlaparyzmiennych
h
T,x
2
i
(
T
–zmiennaniezale»na,
x
2
–zmiennazale»na)war-
to±ci
x
2
malej¡przywzro±ciewarto±ci
T
,coprowadziprzyzastosowaniuheurystyki
nr.3doutworzeniazmiennejodefinicji
T
·
x
2
=
T
·
V
T
,któraodpowiadazmiennej
V
iktór¡pomijamy.Podobnie,rozpatruj¡c
h
x
2
,T
i
(
x
2
–zmiennaniezale»na,
T
–zmiennazale»na),otrzymujemytensamrezultat.
(f)Dlaparyzmiennych
h
V,x
2
i
(
V
–zmiennaniezale»na,
x
2
–zmiennazale»na)war-
to±ci
x
2
malej¡przywzro±ciewarto±ci
x
2
.Wzwi¡zkuztymstosujemyheurystyk¦
nr.3tworz¡czmienn¡odefinicji
x
6
=
V
·
x
2
=
V
·
V
T
=
V
2
T
.Dalej
zauwa»amy,»ezmienna
x
5
matak»estał¡warto±¢równ¡0.0024918ajejdefinicjajest
postaci
T
V
2
,cojestoczywi±cieodwrotno±ci¡uzyskanychwynikówdlazmiennych
x
4
i
W0PP07P00D45-03
Z0PP07P00D45-03
Gliwice2003-02-01 -5/7-
dopisujemyjedo(Tab5).
T
.Podobnie,rozpatruj¡c
h
x
2
,V
i
(
x
2
–zmiennaniezale»na,
T
–zmiennazale»na),otrzymujemytensam
rezultat.Wyznaczamywarto±cizmiennej
x
6
idopisujemyjedotabeli(Tab.7).
3.Dysponujemyterazzbiorem
{
T,V,x
1
,x
2
,x
3
,x
4
,x
5
,x
6
}
,dlaktóregomo»emyzauwa»y¢
»ezmienne
x
4
i
x
6
maj¡stał¡warto±¢równ¡401.32orazt¡sam¡definicj¦
V
2