scanned by camscanner - wordpress.com...c 1/ w k q p Ý c1 ) q e u a j y,. 锂...
TRANSCRIPT
Scanned by CamScanner
Scanned by CamScanner
园
矽ー
ペ·
.。、
、。一
色
之
琶
Scanned by CamScanner
Scanned by CamScanner
Scanned by CamScanner
Scanned by CamScanner
Scanned by CamScanner
Scanned by CamScanner
Scanned by CamScanner
Scanned by CamScanner
易。。
パ
从ーけ
、
イー
一
.
一
。
8歹
니丁
ーぐづ
斗舞
ず
。。一
台、
もー一、
久
一
·.
。
。
、
廿。
。
、
。だ
了、。.。
扣..。
。、。
夕一
节
、。
中、
适
枣司
\
r
.
a
,m.
.
r
年)
り
研
러
悉孙
矿
V
e
N)
W
.
m
Ä ¥
巴
ケ台
8
守て
と
次
窄育昏
宇
P)
D E&
:
电
り
包阿
」飞
やー督
弘
い
.
。.。
百
、
自。
一
ダJ,
# ¢
0 Lヨ
如。
久仁
针
.。
一
「
气메
"ロ
ロ
ヘ
歹。
」
^
唏。
づ
。「
。
ーン日、。
主
\ l
辛
黟(
一
多斛기
箔一
阜良
尹昏。
.
手
S(
一
ヘ、
享。
ト
イ
.
: P.
\
: y
\ 令中
と
ー呐唧
ミ
阜一
匹デ
ー
与户
留。
.
-
斗杆
E m
0
5 ¢
3 0
一
乌
W气
兮卟
Scanned by CamScanner
。」
に
イ
一
》
ーぴ、
叶
r
§
n氏
k
き
ーざ更
弘区。。一
u手中
。
一
-
一
勾·
耳
斗。
。一
。、
、
、
一
、
一。、
一
一
飞ヘ、
一、
ー
い
三けー
けー
、一
、
一一
一
"·.
\....
-
.
.
」
一
一一一。
。
一一
其一.
。
浓。
一
..
,,.
d
:/
,,
,-.
专も。。。
门、
介。
。
ー
い。。レ
6
.
.
か一
'人
。、。
智苛。。
恕
ート对
台や
卜。
合^
。
争舒城
寸
、
弘令
咔
。
ヴ。。
ミー
姑
"...
^ .
占
若一
一.。
「一
、
。
。、
砖一一
一
。
一飞
己一
。
、
。
句
。
一。。
一一一
一
、
切
住住
一
一.
。
。。
·。
共、
ー
ヘ
ー
一一
一
、
一
、
一
飞臼。。
七
啾
ヘソ
6イ
ヘー
り.-
卜げ
中。.
私
各。
飞只
、。。
、
/、
く
一
卜5。
午
歹。
、
君
旮 답.. e
论
。
..。
合ー
と
声^严
6
Q
一一.も。.。
卜
と
먕. 一
等 。
、
u 口
、一
一
'·
$
h ;
"一
、。
旨乱
。
ーハ
L /
Scanned by CamScanner
Scanned by CamScanner
Scanned by CamScanner
Scanned by CamScanner
Scanned by CamScanner
Scanned by CamScanner
Scanned by CamScanner
亭キ
、
(
邑
·
一
叵丁、(。
ヘ。
り
@e (
b
0
)
-
e
납 キ
.
..
气じ。
飞.。
Scanned by CamScanner
Scanned by CamScanner
Scanned by CamScanner
Scanned by CamScanner
Scanned by CamScanner
.
.
> .
o.
o £
..
o。
o
女
デ色、
ノ·
芬一
一
。
桂-(。
ミ
昏、
莲一
。
相·。
名
"
讼
衣 广。。
。
ご ·
分 ^。
名 라、
、
马、
断
0
\
(
Fx
-
? ·
.
) p
ドソ
ド
只
椒ぜ
年
力。
(
址
昏、。
。
气 一
、
ミ-
8、
以
뇹、
气
一
葵一
一
、
。、
、。
为一
.
幺
ら
町一
俨
军心
年气
、
コー
\ー
ミロ
ソ
士띠
リ
ロ
ヘ
白口
デ
匹蹇。
ごー
予
八
す
ー、
一
、勾
一一
V
£
R
\
K
r
一
ーじ
恶
中
豪イ
习
公
唏ヘ。
手飞
、
专一
、
竺、
P
r
习
ヘ
嘎·
飞
。
本8ミ、
飞一
乙^、
计一
二一
。
矗
なー
中
-
墓。
コ
凸
게
势一一ー
ガ
ア。
。一
木
琴
い
年
ふ。
人
に戈
イ
ー
:
3
卜
吆-
e、
唏
纱、
飞
.
一
ミ^
。
ソ
巳。
飞
萨
才ぎ斗
、
。
じp卜
、
イ
ー
守
。
/
ネ
曾
飞、
ぞ。、、
弯
喝ヘ.一
丁
唯、
。
之
·
飞一
役。
。
v
く
胃飞
一
气
伊
哇-
B
イ
司
りー
可
使-
.一
一、
矿荏一
、
1
ヘ、
E飞ー
オ
イ旷
ぎ)
。
"
)·
U
0 V m
F
L . È
夕.
X
Scanned by CamScanner
歹
: :
./
+,
/.
.
°(一
人.-
。
を。
·
-。、
ぐ
。
啧、
&ペ
、
逐一
、
扒下
。
。一。.、
。
ヤ.。。
夕
七、
啧、
eく
、
、。
」
、
-一
勺
、
。
令ー
ミーベ
·
·
飞)。
审。
中
孤寡
ー
シ
'
.。
、
」
·
中·
一
、
一
卟ー
ら
。
「
。
っー
ミー
オ以。
气、
一
..一一
砝-、
、
。
。
.
、一、
督驭一
醒
。
。
显。一
-(.一
イ.
「·
.。
)
仅
、
一ー
イー、。
。、
、
う
到卑非
"
ヘ
确
争气。
之。
口飞。
イ甘
孓、
.、
死守
守虬罗矿
®
g
.
.
.
.
.
S.
¢.
昆
お佶
。
孕。
宇
ミ、
一
g廿
ア
。
ぐ。。
々
.1
廿
。
西·
。一
·
か.
.
。
.
ヒー
、一
ヒタ
ー
。
。
二
·。
矿。
。
。
之占
弘
、
嗤旨。
。、
、
一
°
& .
. W
/
#
. , : : i
令笆
Scanned by CamScanner
F -
3
0
;
6 l
撼
合一
夸
毛
し
矿
苞事
ミ
ー
Fm
右五
入
圣署迅
守
甚每许
e
ア
曳
ンひ。
ー
イし
十
千ヘ与
号、
X
ら
化 ヘ
니
ソ
、
」
厂
\
良多一」
·
一
냑
ー
り
丁一
与
。
ー
メ、
一)
、
メ
ヨーバ
、
'E .
零歹
g a a a a l i i u Ë h 4# w » i
,
:
H T
>
ーと晗
、
、一^
一。一
ト
。
苣。
ん
、
、
涵
い
ド
多。
吧
。
熟
、
首食邕
一.
仁川
·一
一专一。
を一
一
一
如
/-
匆
ーく
:
=
#
.
一
.
二一
·
。一
一
一一
一一
鑫
傣巴
一
=
ぢ陲
二^
旨一
良昏
の
分
ヌ巨一
节
辛。
巴
し
兮-.
)
、小
(。
ペ)
、
习
ぺい
式叫
虚千ヤ
育ヨ亿
弘
J
)
:吼ず
匕
Scanned by CamScanner
e
Scanned by CamScanner
匾三三土二通 血 益 一.
习ヤ
ー
一
。
上
)、
(。
。
户
)。
(
レ、
)、
一
ご
仁一
一
Y
ノノ
一々概
。
叩
一
守。
下
ヘ(
。
」
ヨヘ一
)
、
曾十
(、、
でー
ポ
パ
+
パ、
什
亭、
」
、
ヘ
匕
懿
十
千
十
ー
ヰ
ニ汁トツ
ド
ド。
/ /
E
\
\
文
1ロ
手丁
h n
一
X
ーペ。
寸
æ
ー
くー
二
螽着
Scanned by CamScanner
一
公。
)
、
节个
)
(
界
一)
守.
)一
昌
伽
々)
^
g
幻
如
ヰ
斗
ソ
ヰド
斗
田
丰
和
十
孕十ご
け
ド
咩
如酉冲
し
旨也午
亨
)
-
8
e
\K
u
8仁
化ミ
挲も
斗
去n
墨
き汉
口」
밗
卜
代
人
ミ之」
(
た仁
ヤ
。
、
隽
歹一一
。
一
」
曾卜
售四
.
6
ー
バ
一
售三
ーパ.
一
ミ
、
。
。
孓
。
卜X
令
。
ー ヲ
마 一
飞
니 イ.、、
孙
沪
了
三
%°
Scanned by CamScanner
召i
歹づ(
口か
旬
巴ん
卜
阅瓠攀辱 蹋 リン . 下 了
专
曳
野加ヒ
ミ
。
讨马
い냐
砖石
、
。
唯一罐
一
一
彝
( U P
ら
Scanned by CamScanner
::
.
ドrヘ
\
ー
ト
ビ十
:;::;.:.Y.
:
:
.
: :
i:..--...-
デ
ド
训卜
年移妤
枚
\
暴怒
罐w
戏
泰じ才
武
ート
ー
© 唧 马 わ 弘 ' " ' " à 阐
C 1/ W
k q p Ý c 1 ) q e u a J y ,
.
锂 J队是感レ日诮配メ 够 靶心し 厌 百位 石ろ'
马 良
' w n o yf " e i B A L b É Z & b u 1
T + 5 h b o l t q Þw . d b Y % ¬ C c° 1
oa Lw > Æ .w 1r 7 ì e / u u
'r )
H Ðb j e L · c J e c h e
d e N-
eQ ¢A r %d 1 m? öblG t , h
P ¬ 1 m · M
? z A j A D
j e L t! 1 L
c A ¬ c m n n ¬ Ø e h r eA
; m &w o
p ° '
9 4 e cx
Scanned by CamScanner
B 1RC H B a 1a n c e d 1t e r a t iv e R e d u c i n g a n d c 1u s t e r in gB I RCH is a n i n t e gr a t e d h ie r a r c h ic a l c lu s te r in g m e tho d I t in t r o du ces tw o co n
a c h ie v e go o d s p e e d a n d s c a la b i l it y in la rge da t a ba se s BI Rc H is a lso eñ e c t iw fo r
in c r e m e n t a l a n d d y n a m ic c l u s t e r i n g o f i n c o m i n g o bje c t s H t / ha v e a c lo se r lo o k
o bje c t s {o i i n a subcl ust e t h e n the c F o f t he su bc l u st e r is de lin ed as
r i z in 吕 i n fo r m a t i o n a bo u t s u bc l u s t e r s o f o bjec t s Giv en N d 山 m e n s io n a l po in ts o r
CF = (N , 1S
, SS) , (8 19)
(i . e , E , ) . A n d 5S is t he sq u a r e su m o f da ta po in t s e , E£] 2)
A c iu s t e r i n g fe a t u r e is e s s e n t i a lly a s u m m a r y o f the s t a t is t ic s fo r the Biv m su b
c l u s t e r t he z e r o t h , fi r s t , a n d s e c o n d M o m e n t s o f the su bc l u st e r fr o m a s t a t ist ic al
po i n t o f v i e w I t r e g is t e r s c r u c i a l m e a s u r e m e n t s fo r c o m pu t in g c lu s te r s a n d u t i
l iz e s s t o r a ge e f fi c ie n t ly s i n c e i t s u m m a r i z e s the in fo r m a t io n a bo u t the su bc lu s t er s
o f o bj e c t s i n s t e a d o f s t o r i n g a l l o bje s
tha t
Figu r e 8 6 By deDn it io n , a n o n leaf
n o de in a t r e e h a s d e s c e n de n t s o r " Chi l dren' The n o n le a f n o des s to r e su m s o f
t he c Fs o f t h e i r c h i ld r e n , a n d t hk s s u m m a r ize c lu s t e r in g in fo r m a t io n abo u t the ir
a t t he le a f n o d e s o f t h e t r e e Th e se t ï V0 pa r a 1i e t e r s in flu en c e the s iz e o f t he r esu l t in gc h i l d r e n A c F t r e e h a s t w o pa r a m e e r
br a n hi ng j la ro r , B ,
a n d rhr e$ho td, T The
t r e e° H o w do e s t he B1R H a lgo D thN Y w o RP I t co n sis t s o f t w o phases
Scanned by CamScanner
c a n be v iew e d a s a n 1u l t i le v e l c o m p r es s io n o f t he da t a t ha t t r ies to pr © e 1lBci n he r e n t c lu s t e r i n g s t r u c t u r e o f t h e dàt a
pha se 2 BI Rc H a ppl ie s a (s e l e c t e d) c 1u s t e r in g a lgo r i t hm t o c lu st er the leafn o de s o f t he CF t r e e
Fo r p ha se 1,
th e GF t r e e is b u i l t dyn a m i c a l ly a s o bjec t s a r e in se r t ed Thu s, the
m e t ho d is i n c r e m e n t a l A n o b je c t is in s e r t e d t o t h e c lo s e s t le a f e n t w (s u bc lu ster )I f t h e d ia m e t e r o f t h e s u b c l u st e r st o r e d in t h e le a f n o de a De r in se r t io n is la r ger
t h a n t h e t h r e sho ld v a lu e , t h e n t he 1e a f n o de a n d p o s s ibly o t he r n o des a r e spliL
A f t e r t he in s e r t io n o f t he n e w o bje c t , in fo r m a t i o n a bo u t i t i s p a ss ed to w a r d thc
r o o t o f t he t r e e The s i z e o f t h e C F t r e e c a n be c h a n ge d by m o di fyi n g the thr esho ld
I f t he s i z e o f t h e m e m o r y t h a t i s n e e de d fo r s t o r in g t h e C F t r e e is la r ge r tha n the
s i z e o f t he m a in m e m ó r h t h e n a s m a l l e r t h r e s h o ld v a l u e c a n be sp e c iDed a n d the
C F t r e e is r e b u il t T h e r e b u i1d p r o c e s s is pe r fo r m e d by b u i ld in g a n e w t r ee fnom jt he le a f n o d e s o f t h e o l d t r e e T h u s
, t h e p r o c e s s o f r e bu i ld in g t he t r ee is do net
w i t ho u t t h e n e c e s s i t y o f r e r e a d i n g a l l o f t h e o b je c t s o r p o i n t s T h is i s s im i la r to thej
in s e r t i o n a n d n o de s p l i t i n t h e c o n s t r u c t i o n o f B+ t r e e s T he r e fo r e , fo r bu ildinq
th e t r e e , d a t a h a s t o b e r e a d ju s t o n c e So m e h e u r i s t ic s a n d m e tho ds hav e been
i n t r o d u c ed t o d e a l w i t h o u t l i e r s a n d i m p r o v e t h e q u a l i t y o f c F t r e e s by a ddit io ti al
s c a n s o f t h e d a t a A f t e r t he c F t r e e i s b u i l t, a n y c l u s t e r i n g a lgo r i thm ,
su ch as a
t yþic a 1 p a r t i t i o n i n g a lgo r i t h m,
c a n b e u s e d W i t h t h e C F t r e e in Ph a se 2
BI RC H t r i e s t o p r o d u c e t h e be s t c l u s t e r s w i t h t h e a v a i la ble r e so u r ce s Given a
1i m i t e d a m o u n t o f m a i n m e m o r y , a n i m p o r t a n t c o n s id e r a t i o n i s to m in im ize thej
t i m e r e q u i r e d fo r 1/ 0 B I RC H a p p l i e s a m u l t ip ha s e c lu s t e r i n 吕 t e c h n iqu e a s ingt
s c a n o f t h e d a t a s e t y ie 1d s a b a s ic bo o d c lu s t e r i n s , a n d o n e o r m o r e addit io na:
th e d a t a H o w e v e r,
s i n c e e a c h n o d e i n a c F t r e e c a n h o ld o n ly a un i t ed ï 1ua1b
c o n t r o l t h e b o u n da r y o f a c l u s t e r
a b
E a n n M Te A n I . i l
\ l
Scanned by CamScanner
' " i 1 1 a a t a r n a y r e q u i n e o (n 2 ) t im e fo r n o bje c t s in the w o r s t
U 1s c o v e r i n g a r bi t r a r ily
.
D e n s i t y - B a s e d M e t h o d s
To d is c o v e r c l u s t e r s w i t h a r b i t r a r y sha pe , d e n s i t y ba s e d c 1 u s t e D n B mhods ha v eda ta spa c e t h a t a r e s e p a r a t e d by r e g io n s o f lo w de n s i t y (r e p r e se n t i ng n o ise )8
. 6
. l D B SC A N A D e n s i t y - B a s e d C 1u s t e r in g M e t ho d B a s e d o n
D BSCA N (D e n s i t y B a s e d Spa t ia l Cl u s t e r i n g o f A pp l ic a t io n s w it h No ise ) is ade n s it y b a s e d c l u s t e r i n g a lgo r i t h m T he a 18o r i t hm gr o w s r e gio n s w it h s u f fic ien t lyh igh de n s i t y i n t o c l u s t e r s a n d d isc o v e r s c l u s t e r s o f a r b it r a r y s ha pe in s pa t ia l da taba se s w i t h n o is e I t d e %n e s a c 1u s t e r a s a m a x im a l se t o f de n s i ty c o n n e c t e r l po in t sT he ba s i c id e a s o f d e n s i t y ba se d c l u s t e r in 吕 i n v o lv e a n u m be r o f n e w de f in it io n sWe in t u it iv e l y p r e s e n t t he s e d e fin i t i o n s , a n d t he n fo 11o w u p w it h a n e x a m p le
》 Th e n e ighbo r h o o d w i t h i n a r a d i u s ¬ o f a giv e n o bjec t is c a l1ed the ¬ n e ighbo r
ho o d o f t h e o b je c t
1B I f t h e ¬ n e ighb o r h o o d o f a n o bje c t c o n t a i n s a t lea st a m in im u m n u m be r ,
M i n p t s,
o f o bj e c t s , t h e n th e o b je c t is c a 1le d a c o r e o bje c t
G i ve n a se t of ob j ec t s, D,
we say tha t an ob j ec t p is di re 】y dens i ty- eac hab l e
fr o m o bj e c t q i f p i s w i t h in t he ¬ n e ighbo r ho o d o f q, a n q is a co r e o bje c t
s e t o f o bj e c t s , D
, i f t h e r e i s a c h a i n o f o bje c t s p 1, , p. . p l - q a n d p. .
- P su c h
t h a t p i + f is d i r e c t l y d e n s i t y r e a c h a bl e fr o m p i w i th r e spe c t t o ¬ a n d M in pt s , fo r
= A n o bje c t p i s d e n s i t y c o n n e e d t o o bje c t q w i th r espe c t t o ¬ a n d M i rï Pts i n a
s e t o f o bj e c t s , D
, i f t h e r e is a n o bje c t o ¬ D s u ch tha t bo th p a n d q a re de n s it y
r e a c ha ble f r o m ( w i t h r e s pe t o ¬ a n d M i tt Pt s
D e n s i t y r e a c h a b i l i t y is t h e t r a n s i t i v e cl osure o f di r e c t de n si ty reachabi l i t a n d
th is r e l a t i o n sh ip i s a sym m e ° ic o n ly c o r e o bje c t s a r e m u t u a l ly de n s it y r eachable
D e n s i t y c o n n e c t iv i t y, h o w e v e r }
is a symmetric r e la t io n