最近搜尋

沒有找到結果。

標籤

沒有找到結果。

文件

沒有找到結果。

上傳

首頁學校主題

登錄

Machine Learning Techniques (ᘤᢈ)

Share "Machine Learning Techniques (ᘤᢈ)"

N/A

N/A

Protected

學年: 2022

Info

Protected

Academic year: 2022

Share "Machine Learning Techniques (ᘤᢈ)"

Copied!

25

0

0

25

0

0

加載中.... (立即查看全文)

立即下載 ( 25 頁 )

全文

(1)

Machine Learning Techniques ( 機器學習技巧)

Lecture 13: RBF Networks

Hsuan-Tien Lin (林軒田) [email protected]

Department of Computer Science

& Information Engineering

National Taiwan University

( 國立台灣大學資訊工程系)

(2)

RBF Networks

Agenda

Lecture 13: RBF Networks Full RBF Model

Prototype Extraction RBF Network

Connection to Other Views

(3)

RBF Networks Full RBF Model

Disclaimer

Many parts of this lecture borrows

Prof. Yaser S. Abu-Mostafa’s slides with permission.

Learning From Data

YaserS.Abu-Mostafa

CaliforniaInstituteofTe hnology

Le ture16:RadialBasisFun tions

•

(4)

RBF Networks Full RBF Model

Basi RBFmodel

LearningFromData-Le ture16 3/20

Basi RBFmodel

Ea h

(x n , y n ) ∈ D

^inuen
es

h(x)

^based^on

kx − x | {z } n k

radial

LearningFromData-Le ture16 3/20

Basi RBFmodel

Ea h

(x n , y n ) ∈ D

^inuen
es

h(x)

^based^on

k | {z } x − x n k

radial

LearningFromData-Le ture16 3/20

Basi RBFmodel

Ea h

(x n , y n ) ∈ D

^inuen
es

h(x)

^based^on

k | {z } x − x n k

radial

Standard form:

h(x) = X N n=1

w n exp

−γ kx − x n k ²

| {z }

basisfun tion

LearningFromData-Le ture16 3/20

Basi RBFmodel

Ea h

(x n , y n ) ∈ D

^inuen
es

h(x)

^based^on

k | {z } x − x n k

radial

Standard form:

h(x) = X N n=1

w n exp

−γ kx − x n k ²

| {z }

basisfun tion

LearningFromData-Le ture16 3/20

Basi RBFmodel

Ea h

(x n , y n ) ∈ D

^inuen
es

h(x)

^based^on

k | {z } x − x n k

radial

Standard form:

h(x) = X N n=1

w n exp

−γ kx − x n k ²

| {z }

basisfun tion

LearningFromData-Le ture16 3/20

Basi RBFmodel

Ea h

(x n , y n ) ∈ D

^inuen
es

h(x)

^based^on

k | {z } x − x n k

radial

Standard form:

h(x) = X N n=1

w n exp

−γ k x − x n k ²

| {z }

basisfun tion

LearningFromData-Le ture16 3/20

Basi RBFmodel

Ea h

(x n , y n ) ∈ D

^inuen
es

h(x)

^based^on

k | {z } x − x n k

radial

Standard form:

h(x) = X N n=1

w n exp

−γ k x − x n k ²

| {z }

basisfun tion

LearningFromData-Le ture16 3/20

Basi RBFmodel

Ea h

(x n , y n ) ∈ D

^inuen
es

h(x)

^based^on

k | {z } x − x n k

radial

Standard form:

h(x) = X N n=1

w n exp

−γ k x − x n k ²

| {z }

basisfun tion

LearningFromData-Le ture16 3/20

Basi RBFmodel

Ea h

(x n , y n ) ∈ D

^inuen
es

h(x)

^based^on

k | {z } x − x n k

radial

Standard form:

h(x) = X N n=1

w n exp

−γ k x − x n k ²

| {z }

basisfun tion

LearningFromData-Le ture16 3/20

Basi RBFmodel

Ea h

(x n , y n ) ∈ D

^inuen
es

h(x)

^based^on

k | {z } x − x n k

radial

Standard form:

h(x) = X N n=1

w n exp

−γ k x − x n k ²

| {z }

basisfun tion

LearningFromData-Le ture16 3/20

(5)

RBF Networks Full RBF Model

Thelearning algorithm

Finding

w 1 , · · · , w N

^:

h(x) = X N n=1

w n exp

−γ kx − x n k ²

basedon

D = (x 1 , y 1 ), · · · , (x N , y N ) E

in

= 0

^:

h(x n ) = y n

^for

n = 1, · · · , N

^:

X N m=1

w m exp

−γ kx n − x m k ²

= y n

LearningFromData-Le ture16 4/20

Thelearning algorithm

Finding

w 1 , · · · , w N

^:

h(x) = X N n=1

w n exp

−γ kx − x n k ²

basedon

D = (x 1 , y 1 ), · · · , (x N , y N ) E

in

= 0

^:

h(x n ) = y n

^for

n = 1, · · · , N

^:

X N m=1

w m exp

−γ kx n − x m k ²

= y n

LearningFromData-Le ture16 4/20

Thelearning algorithm

Finding

w 1 , · · · , w N

^:

h(x) = X N n=1

w n exp

−γ kx − x n k ²

basedon

D = (x 1 , y 1 ), · · · , (x N , y N ) E

in

= 0

^:

h(x n ) = y n

^for

n = 1, · · · , N

^:

X N m=1

w m exp

−γ kx n − x m k ²

= y n

LearningFromData-Le ture16 4/20

Thelearning algorithm

Finding

w 1 , · · · , w N

^:

h(x) = X N n=1

w n exp

−γ kx − x n k ²

basedon

D = (x 1 , y 1 ), · · · , (x N , y N ) E

in

= 0

^:

h(x n ) = y n

^for

n = 1, · · · , N

^:

X N m=1

w m exp

−γ kx n − x m k ²

= y n

LearningFromData-Le ture16 4/20

Thelearning algorithm

Finding

w 1 , · · · , w N

^:

h(x) = X N n=1

w n exp

−γ kx − x n k ²

basedon

D = (x 1 , y 1 ), · · · , (x N , y N ) E

in

= 0

^:

h(x n ) = y n

^for

n = 1, · · · , N

^:

X N m=1

w m exp

−γ kx n − x m k ²

= y n

LearningFromData-Le ture16 4/20

Thelearning algorithm

Finding

w 1 , · · · , w N

^:

h(x) = X N n=1

w n exp

−γ kx − x n k ²

basedon

D = (x 1 , y 1 ), · · · , (x N , y N ) E

in

= 0

^:

h(x n ) = y n

^for

n = 1, · · · , N

^:

X N m=1

w m exp

−γ kx n − x m k ²

= y n

LearningFromData-Le ture16 4/20

Thelearning algorithm

Finding

w 1 , · · · , w N

^:

h(x) = X N n=1

w n exp

−γ kx − x n k ²

basedon

D = (x 1 , y 1 ), · · · , (x N , y N ) E

in

= 0

^:

h(x n ) = y n

^for

n = 1, · · · , N

^:

X N m=1

w m exp

−γ kx n − x m k ²

= y n

LearningFromData-Le ture16 4/20

Thelearning algorithm

Finding

w 1 , · · · , w N

^:

h(x) = X N n=1

w n exp

−γ kx − x n k ²

basedon

D = (x 1 , y 1 ), · · · , (x N , y N ) E

in

= 0

^:

h(x n ) = y n

^for

n = 1, · · · , N

^:

X N m=1

w m exp

−γ kx n − x m k ²

= y n

LearningFromData-Le ture16 4/20

Thelearning algorithm

Finding

w 1 , · · · , w N

^:

h(x) = X N n=1

w n exp

−γ kx − x n k ²

basedon

D = (x 1 , y 1 ), · · · , (x N , y N ) E

in

= 0

^:

h(x n ) = y n

^for

n = 1, · · · , N

^:

X N m=1

w m exp

−γ k x n − x m k ²

= y n

LearningFromData-Le ture16 4/20

Thelearning algorithm

Finding

w 1 , · · · , w N

^:

h(x) = X N n=1

w n exp

−γ kx − x n k ²

basedon

D = (x 1 , y 1 ), · · · , (x N , y N ) E

in

= 0

^:

h(x n ) = y n

^for

n = 1, · · · , N

^:

X N m=1

w m exp

−γ k x n − x m k ²

= y n

LearningFromData-Le ture16 4/20

(6)

RBF Networks Full RBF Model

Thesolution

X N m=1

w m exp

−γ kx n − x m k ²

= y n N

^equationsⁱⁿ

N

^unknowns



 

 

exp(−γ kx 1 − x 1 k ² ) . . . exp(−γ kx 1 − x N k ² ) exp( −γ kx 2 − x 1 k ² ) . . . exp( −γ kx 2 − x N k ² )

.

.

.

.

.

.

.

.

.

exp( −γ kx N − x 1 k ² ) . . . exp( −γ kx N − x N k ² )



 

 

| {z }

Φ



 

  w 1

w 2

.

.

.

w N



 

 

| {z } w

=



 

  y 1

y 2

.

.

.

y N



 

 

| {z } y

If

Φ

^isinvertible,

w = Φ ⁻¹ y

^exa
tinterpolation

LearningFromData-Le ture16 5/20

Thesolution

X N m=1

w m exp

−γ kx n − x m k ²

= y n N

^equationsⁱⁿ

N

^unknowns



 

 

exp(−γ kx 1 − x 1 k ² ) . . . exp(−γ kx 1 − x N k ² ) exp( −γ kx 2 − x 1 k ² ) . . . exp( −γ kx 2 − x N k ² )

.

.

.

.

.

.

.

.

.

exp( −γ kx N − x 1 k ² ) . . . exp( −γ kx N − x N k ² )



 

 

| {z }

Φ



 

  w 1

w 2

.

.

.

w N



 

 

| {z } w

=



 

  y 1

y 2

.

.

.

y N



 

 

| {z } y

If

Φ

^isinvertible,

w = Φ ⁻¹ y

^exa
tinterpolation

LearningFromData-Le ture16 5/20

Thesolution

X N m=1

w m exp

−γ kx n − x m k ²

= y n N

^equationsⁱⁿ

N

^unknowns



 

 

exp(−γ kx 1 − x 1 k ² ) . . . exp(−γ kx 1 − x N k ² ) exp( −γ kx 2 − x 1 k ² ) . . . exp( −γ kx 2 − x N k ² )

.

.

.

.

.

.

.

.

.

exp( −γ kx N − x 1 k ² ) . . . exp( −γ kx N − x N k ² )



 

 

| {z }

Φ



 

  w 1

w 2

.

.

.

w N



 

 

| {z } w

=



 

  y 1

y 2

.

.

.

y N



 

 

| {z } y

If

Φ

^isinvertible,

w = Φ ⁻¹ y

^exa
tinterpolation

LearningFromData-Le ture16 5/20

Thesolution

X N m=1

w m exp

−γ kx n − x m k ²

= y n N

^equationsⁱⁿ

N

^unknowns



 

 

exp(−γ kx 1 − x 1 k ² ) . . . exp(−γ kx 1 − x N k ² ) exp( −γ kx 2 − x 1 k ² ) . . . exp( −γ kx 2 − x N k ² )

.

.

.

.

.

.

.

.

.

exp( −γ kx N − x 1 k ² ) . . . exp( −γ kx N − x N k ² )



 

 

| {z }

Φ



 

  w 1

w 2

.

.

.

w N



 

 

| {z } w

=



 

  y 1

y 2

.

.

.

y N



 

 

| {z } y

If

Φ

^isinvertible,

w = Φ ⁻¹ y

^exa
tinterpolation

LearningFromData-Le ture16 5/20

Thesolution

X N m=1

w m exp

−γ kx n − x m k ²

= y n N

^equationsⁱⁿ

N

^unknowns



 

 

exp(−γ kx 1 − x 1 k ² ) . . . exp(−γ kx 1 − x N k ² ) exp( −γ kx 2 − x 1 k ² ) . . . exp( −γ kx 2 − x N k ² )

.

.

.

.

.

.

.

.

.

exp( −γ kx N − x 1 k ² ) . . . exp( −γ kx N − x N k ² )



 

 

| {z }

Φ



 

  w 1

w 2

.

.

.

w N



 

 

| {z } w

=



 

  y 1

y 2

.

.

.

y N



 

 

| {z } y

If

Φ

^isinvertible,

w = Φ ⁻¹ y

^exa
tinterpolation

LearningFromData-Le ture16 5/20

Thesolution

X N m=1

w m exp

−γ kx n − x m k ²

= y n N

^equationsⁱⁿ

N

^unknowns



 

 

exp(−γ kx 1 − x 1 k ² ) . . . exp(−γ kx 1 − x N k ² ) exp( −γ kx 2 − x 1 k ² ) . . . exp( −γ kx 2 − x N k ² )

.

.

.

.

.

.

.

.

.

exp( −γ kx N − x 1 k ² ) . . . exp( −γ kx N − x N k ² )



 

 

| {z }

Φ



 

  w 1

w 2

.

.

.

w N



 

 

| {z } w

=



 

  y 1

y 2

.

.

.

y N



 

 

| {z } y

If

Φ

^isinvertible,

w = Φ ⁻¹ y

^exa
tinterpolation

LearningFromData-Le ture16 5/20

Thesolution

X N m=1

w m exp

−γ kx n − x m k ²

= y n N

^equationsⁱⁿ

N

^unknowns



 

 

exp(−γ kx 1 − x 1 k ² ) . . . exp(−γ kx 1 − x N k ² ) exp( −γ kx 2 − x 1 k ² ) . . . exp( −γ kx 2 − x N k ² )

.

.

.

.

.

.

.

.

.

exp( −γ kx N − x 1 k ² ) . . . exp( −γ kx N − x N k ² )



 

 

| {z }

Φ



 

  w 1

w 2

.

.

.

w N



 

 

| {z } w

=



 

  y 1

y 2

.

.

.

y N



 

 

| {z } y

If

Φ

^isinvertible,

w = Φ ⁻¹ y

^exa
tinterpolation

LearningFromData-Le ture16 5/20

Thesolution

X N m=1

w m exp

−γ kx n − x m k ²

= y n N

^equationsⁱⁿ

N

^unknowns



 

 

exp(−γ kx 1 − x 1 k ² ) . . . exp(−γ kx 1 − x N k ² ) exp( −γ kx 2 − x 1 k ² ) . . . exp( −γ kx 2 − x N k ² )

.

.

.

.

.

.

.

.

.

exp( −γ kx N − x 1 k ² ) . . . exp( −γ kx N − x N k ² )



 

 

| {z }

Φ



 

  w 1

w 2

.

.

.

w N



 

 

| {z } w

=



 

  y 1

y 2

.

.

.

y N



 

 

| {z } y

If

Φ

^isinvertible,

w = Φ ⁻¹ y

^exa
tinterpolation

LearningFromData-Le ture16 5/20

Thesolution

X N m=1

w m exp

−γ kx n − x m k ²

= y n N

^equationsⁱⁿ

N

^unknowns



 

 

exp(−γ kx 1 − x 1 k ² ) . . . exp(−γ kx 1 − x N k ² ) exp( −γ kx 2 − x 1 k ² ) . . . exp( −γ kx 2 − x N k ² )

.

.

.

.

.

.

.

.

.

exp( −γ kx N − x 1 k ² ) . . . exp( −γ kx N − x N k ² )



 

 

| {z }

Φ



 

  w 1

w 2

.

.

.

w N



 

 

| {z } w

=



 

  y 1

y 2

.

.

.

y N



 

 

| {z } y

If

Φ

^isinvertible,

w = Φ ⁻¹ y

^exa
tinterpolation

LearningFromData-Le ture16 5/20

Thesolution

X N m=1

w m exp

−γ kx n − x m k ²

= y n N

^equationsⁱⁿ

N

^unknowns



 

 

exp(−γ kx 1 − x 1 k ² ) . . . exp(−γ kx 1 − x N k ² ) exp( −γ kx 2 − x 1 k ² ) . . . exp( −γ kx 2 − x N k ² )

.

.

.

.

.

.

.

.

.

exp( −γ kx N − x 1 k ² ) . . . exp( −γ kx N − x N k ² )



 

 

| {z }

Φ



 

  w 1

w 2

.

.

.

w N



 

 

| {z } w

=



 

  y 1

y 2

.

.

.

y N



 

 

| {z } y

If

Φ

^isinvertible,

w = Φ ⁻¹ y

^exa
tinterpolation

LearningFromData-Le ture16 5/20

Thesolution

X N m=1

w m exp

−γ kx n − x m k ²

= y n N

^equationsⁱⁿ

N

^unknowns



 

 

exp(−γ kx 1 − x 1 k ² ) . . . exp(−γ kx 1 − x N k ² ) exp( −γ kx 2 − x 1 k ² ) . . . exp( −γ kx 2 − x N k ² )

.

.

.

.

.

.

.

.

.

exp( −γ kx N − x 1 k ² ) . . . exp( −γ kx N − x N k ² )



 

 

| {z }

Φ



 

  w 1

w 2

.

.

.

w N



 

 

| {z } w

=



 

  y 1

y 2

.

.

.

y N



 

 

| {z } y

If

Φ

^isinvertible,

w = Φ ⁻¹ y

^exa
tinterpolation

LearningFromData-Le ture16 5/20

Thesolution

X N m=1

w m exp

−γ kx n − x m k ²

= y n N

^equationsⁱⁿ

N

^unknowns



 

 

exp(−γ kx 1 − x 1 k ² ) . . . exp(−γ kx 1 − x N k ² ) exp( −γ kx 2 − x 1 k ² ) . . . exp( −γ kx 2 − x N k ² )

.

.

.

.

.

.

.

.

.

exp( −γ kx N − x 1 k ² ) . . . exp( −γ kx N − x N k ² )



 

 

| {z }

Φ



 

  w 1

w 2

.

.

.

w N



 

 

| {z } w

=



 

  y 1

y 2

.

.

.

y N



 

 

| {z } y

If

Φ

^isinvertible,

w = Φ ⁻¹ y

^exa
tinterpolation

LearningFromData-Le ture16 5/20

(7)

RBF Networks Full RBF Model

RBFfor lassi ation

h(x) =

^sign

X N n=1

w n exp

−γ kx − x n k ² !

Learning:

∼

^linear^regression^for lassi ation

s = X N n=1

w n exp

−γ kx − x n k ²

Minimize

(s − y) ²

^on

D y = ±1 h(x) =

^sign

(s)

LearningFromData-Le ture16 7/20

RBFfor lassi ation

h(x) =

^sign

X N n=1

w n exp

−γ kx − x n k ² !

Learning:

∼

^linear^regression^for lassi ation

s = X N n=1

w n exp

−γ kx − x n k ²

Minimize

(s − y) ²

^on

D y = ±1 h(x) =

^sign

(s)

LearningFromData-Le ture16 7/20

RBFfor lassi ation

h(x) =

^sign

X N n=1

w n exp

−γ kx − x n k ² !

Learning:

∼

^linear^regression^for lassi ation

s = X N n=1

w n exp

−γ kx − x n k ²

Minimize

(s − y) ²

^on

D y = ±1 h(x) =

^sign

(s)

LearningFromData-Le ture16 7/20

RBFfor lassi ation

h(x) =

^sign

X N n=1

w n exp

−γ kx − x n k ² !

Learning:

∼

^linear^regression^for lassi ation

s = X N n=1

w n exp

−γ kx − x n k ²

Minimize

(s − y) ²

^on

D y = ±1 h(x) =

^sign

(s)

LearningFromData-Le ture16 7/20

RBFfor lassi ation

h(x) =

^sign

X N n=1

w n exp

−γ kx − x n k ² !

Learning:

∼

^linear^regression^for lassi ation

s = X N n=1

w n exp

−γ kx − x n k ²

Minimize

(s − y) ²

^on

D y = ±1 h(x) =

^sign

(s)

LearningFromData-Le ture16 7/20

RBFfor lassi ation

h(x) =

^sign

X N n=1

w n exp

−γ kx − x n k ² !

Learning:

∼

^linear^regression^for lassi ation

s = X N n=1

w n exp

−γ kx − x n k ²

Minimize

(s − y) ²

^on

D y = ±1 h(x) =

^sign

(s)

LearningFromData-Le ture16 7/20

RBFfor lassi ation

h(x) =

^sign

X N n=1

w n exp

−γ kx − x n k ² !

Learning:

∼

^linear^regression^for lassi ation

s = X N n=1

w n exp

−γ kx − x n k ²

Minimize

(s − y) ²

^on

D y = ±1 h(x) =

^sign

(s)

LearningFromData-Le ture16 7/20

RBFfor lassi ation

h(x) =

^sign

X N n=1

w n exp

−γ kx − x n k ² !

Learning:

∼

^linear^regression^for lassi ation

s = X N n=1

w n exp

−γ kx − x n k ²

Minimize

(s − y) ²

^on

D y = ±1 h(x) =

^sign

(s)

LearningFromData-Le ture16 7/20

RBFfor lassi ation

h(x) =

^sign

X N n=1

w n exp

−γ kx − x n k ² !

Learning:

∼

^linear^regression^for lassi ation

s = X N n=1

w n exp

−γ kx − x n k ²

Minimize

(s − y) ²

^on

D y = ±1 h(x) =

^sign

(s)

LearningFromData-Le ture16 7/20

RBFfor lassi ation

h(x) =

^sign

X N n=1

w n exp

−γ kx − x n k ² !

Learning:

∼

^linear^regression^for lassi ation

s = X N n=1

w n exp

−γ kx − x n k ²

Minimize

(s − y) ²

^on

D y = ±1 h(x) =

^sign

(s)

LearningFromData-Le ture16 7/20

RBFfor lassi ation

h(x) =

^sign

X N n=1

w n exp

−γ kx − x n k ² !

Learning:

∼

^linear^regression^for lassi ation

s = X N n=1

w n exp

−γ kx − x n k ²

Minimize

(s − y) ²

^on

D y = ±1 h(x) =

^sign

(s)

LearningFromData-Le ture16 7/20

RBFfor lassi ation

h(x) =

^sign

X N n=1

w n exp

−γ kx − x n k ² !

Learning:

∼

^linear^regression^for lassi ation

s = X N n=1

w n exp

−γ kx − x n k ²

Minimize

(s − y) ²

^on

D y = ±1 h(x) =

^sign

(s)

LearningFromData-Le ture16 7/20

(8)

RBF Networks Full RBF Model

Relationshipto nearest-neighbor method

LearningFromData-Le ture16 8/20

Relationshipto nearest-neighbor method

Adoptthe

y

^valueôfâ^nearby^point: ^similarêe
t^byâ^basis^fun
tion:

LearningFromData-Le ture16 8/20

Relationshipto nearest-neighbor method

Adoptthe

y

^valueôfâ^nearby^point: ^similarêe
t^byâ^basis^fun
tion:

LearningFromData-Le ture16 8/20

Relationshipto nearest-neighbor method

Adoptthe

y

^valueôfâ^nearby^point: ^similarêe
t^byâ^basis^fun
tion:

LearningFromData-Le ture16 8/20

Relationshipto nearest-neighbor method

Adoptthe

y

^valueôfâ^nearby^point: ^similarêe
t^byâ^basis^fun
tion:

LearningFromData-Le ture16 8/20

(9)

RBF Networks Full RBF Model

Fun Time

(10)

RBF Networks Prototype Extraction

RBFwith

K

^enters

N

^parameters

w 1 , · · · , w N

^based^on

N

^data^points

Use

K ≪ N

^enters:

µ 1 , · · · , µ K

^instead^of

x 1 , · · · , x N

h(x) = X K k=1

w k exp

−γ kx − µ k k ²

1.Howto hoosethe enters

µ k

2.Howto hoosetheweights

w k

LearningFromData-Le ture16 9/20

RBFwith

K

^enters

N

^parameters

w 1 , · · · , w N

^based^on

N

^data^points

Use

K ≪ N

^enters:

µ 1 , · · · , µ K

^instead^of

x 1 , · · · , x N

h(x) = X K k=1

w k exp

−γ kx − µ k k ²

1.Howto hoosethe enters

µ k

2.Howto hoosetheweights

w k

LearningFromData-Le ture16 9/20

RBFwith

K

^enters

N

^parameters

w 1 , · · · , w N

^based^on

N

^data^points

Use

K ≪ N

^enters:

µ 1 , · · · , µ K

^instead^of

x 1 , · · · , x N

h(x) = X K k=1

w k exp

−γ kx − µ k k ²

1.Howto hoosethe enters

µ k

2.Howto hoosetheweights

w k

LearningFromData-Le ture16 9/20

RBFwith

K

^enters

N

^parameters

w 1 , · · · , w N

^based^on

N

^data^points

Use

K ≪ N

^enters:

µ 1 , · · · , µ K

^instead^of

x 1 , · · · , x N

h(x) = X K k=1

w k exp

−γ kx − µ k k ²

1.Howto hoosethe enters

µ k

2.Howto hoosetheweights

w k

LearningFromData-Le ture16 9/20

RBFwith

K

^enters

N

^parameters

w 1 , · · · , w N

^based^on

N

^data^points

Use

K ≪ N

^enters:

µ 1 , · · · , µ K

^instead^of

x 1 , · · · , x N

h(x) = X K k=1

w k exp

−γ kx − µ k k ²

1.Howto hoosethe enters

µ k

2.Howto hoosetheweights

w k

LearningFromData-Le ture16 9/20

RBFwith

K

^enters

N

^parameters

w 1 , · · · , w N

^based^on

N

^data^points

Use

K ≪ N

^enters:

µ 1 , · · · , µ K

^instead^of

x 1 , · · · , x N

h(x) = X K k=1

w k exp

−γ kx − µ k k ²

1.Howto hoosethe enters

µ k

2.Howto hoosetheweights

w k

LearningFromData-Le ture16 9/20

RBFwith

K

^enters

N

^parameters

w 1 , · · · , w N

^based^on

N

^data^points

Use

K ≪ N

^enters:

µ 1 , · · · , µ K

^instead^of

x 1 , · · · , x N

h(x) = X K k=1

w k exp

−γ kx − µ k k ²

1.Howto hoosethe enters

µ k

2.Howto hoosetheweights

w k

LearningFromData-Le ture16 9/20

RBFwith

K

^enters

N

^parameters

w 1 , · · · , w N

^based^on

N

^data^points

Use

K ≪ N

^enters:

µ 1 , · · · , µ K

^instead^of

x 1 , · · · , x N

h(x) = X K k=1

w k exp

−γ kx − µ k k ²

1.Howto hoosethe enters

µ k

2.Howto hoosetheweights

w k

LearningFromData-Le ture16 9/20

RBFwith

K

^enters

N

^parameters

w 1 , · · · , w N

^based^on

N

^data^points

Use

K ≪ N

^enters:

µ 1 , · · · , µ K

^instead^of

x 1 , · · · , x N

h(x) = X K k=1

w k exp

−γ kx − µ k k ²

1.Howto hoosethe enters

µ k

2.Howto hoosetheweights

w k

LearningFromData-Le ture16 9/20

RBFwith

K

^enters

N

^parameters

w 1 , · · · , w N

^based^on

N

^data^points

Use

K ≪ N

^enters:

µ 1 , · · · , µ K

^instead^of

x 1 , · · · , x N

h(x) = X K k=1

w k exp

−γ kx − µ k k ²

1.Howto hoosethe enters

µ k

2.Howto hoosetheweights

w k

LearningFromData-Le ture16 9/20

RBFwith

K

^enters

N

^parameters

w 1 , · · · , w N

^based^on

N

^data^points

Use

K ≪ N

^enters:

µ 1 , · · · , µ K

^instead^of

x 1 , · · · , x N

h(x) = X K k=1

w k exp

−γ kx − µ k k ²

1.Howto hoosethe enters

µ k

2.Howto hoosetheweights

w k

LearningFromData-Le ture16 9/20

RBFwith

K

^enters

N

^parameters

w 1 , · · · , w N

^based^on

N

^data^points

Use

K ≪ N

^enters:

µ 1 , · · · , µ K

^instead^of

x 1 , · · · , x N

h(x) = X K k=1

w k exp

−γ kx − µ k k ²

1.Howto hoosethe enters

µ k

2.Howto hoosetheweights

w k

LearningFromData-Le ture16 9/20

(11)

RBF Networks Prototype Extraction

Choosingthe enters

Minimizethedistan ebetween

x n

^and^the^losest^enter

µ k

^:

K

^-means^lustering

Split

x 1 , · · · , x N

^into^lusters

S 1 , · · · , S K

Minimize

X K k=1

X

x n ∈S k

kx n − µ k k ²

Unsupervisedlearning

NP-hard

LearningFromData-Le ture16 10/20

Choosingthe enters

Minimizethedistan ebetween

x n

^and^the^losest^enter

µ k

^:

K

^-means^lustering

Split

x 1 , · · · , x N

^into^lusters

S 1 , · · · , S K

Minimize

X K k=1

X

x n ∈S k

kx n − µ k k ²

Unsupervisedlearning

NP-hard

LearningFromData-Le ture16 10/20

Choosingthe enters

Minimizethedistan ebetween

x n

^and^the^losest^enter

µ k

^:

K

^-means^lustering

Split

x 1 , · · · , x N

^into^lusters

S 1 , · · · , S K

Minimize

X K k=1

X

x n ∈S k

kx n − µ k k ²

Unsupervisedlearning

NP-hard

LearningFromData-Le ture16 10/20

Choosingthe enters

Minimizethedistan ebetween

x n

^and^the^losest^enter

µ k

^:

K

^-means^lustering

Split

x 1 , · · · , x N

^into^lusters

S 1 , · · · , S K

Minimize

X K k=1

X

x n ∈S k

kx n − µ k k ²

Unsupervisedlearning

NP-hard

LearningFromData-Le ture16 10/20

Choosingthe enters

Minimizethedistan ebetween

x n

^and^the^losest^enter

µ k

^:

K

^-means^lustering

Split

x 1 , · · · , x N

^into^lusters

S 1 , · · · , S K

Minimize

X K k=1

X

x n ∈S k

kx n − µ k k ²

Unsupervisedlearning

NP-hard

LearningFromData-Le ture16 10/20

Choosingthe enters

Minimizethedistan ebetween

x n

^and^the^losest^enter

µ k

^:

K

^-means^lustering

Split

x 1 , · · · , x N

^into^lusters

S 1 , · · · , S K

Minimize

X K k=1

X

x n ∈S k

kx n − µ k k ²

Unsupervisedlearning

NP-hard

LearningFromData-Le ture16 10/20

Choosingthe enters

Minimizethedistan ebetween

x n

^and^the^losest^enter

µ k

^:

K

^-means^lustering

Split

x 1 , · · · , x N

^into^lusters

S 1 , · · · , S K

Minimize

X K k=1

X

x n ∈S k

kx n − µ k k ²

Unsupervisedlearning

NP-hard

LearningFromData-Le ture16 10/20

Choosingthe enters

Minimizethedistan ebetween

x n

^and^the^losest^enter

µ k

^:

K

^-means^lustering

Split

x 1 , · · · , x N

^into^lusters

S 1 , · · · , S K

Minimize

X K k=1

X

x n ∈S k

kx n − µ k k ²

Unsupervisedlearning

NP-hard

LearningFromData-Le ture16 10/20

Choosingthe enters

Minimizethedistan ebetween

x n

^and^the^losest^enter

µ k

^:

K

^-means^lustering

Split

x 1 , · · · , x N

^into^lusters

S 1 , · · · , S K

Minimize

X K k=1

X

x n ∈S k

kx n − µ k k ²

Unsupervisedlearning

NP-hard

LearningFromData-Le ture16 10/20

Choosingthe enters

Minimizethedistan ebetween

x n

^and^the^losest^enter

µ k

^:

K

^-means^lustering

Split

x 1 , · · · , x N

^into^lusters

S 1 , · · · , S K

Minimize

X K k=1

X

x n ∈S k

kx n − µ k k ²

Unsupervisedlearning

NP-hard

LearningFromData-Le ture16 10/20

Choosingthe enters

Minimizethedistan ebetween

x n

^and^the^losest^enter

µ k

^:

K

^-means^lustering

Split

x 1 , · · · , x N

^into^lusters

S 1 , · · · , S K

Minimize

X K k=1

X

x n ∈S k

kx n − µ k k ²

Unsupervisedlearning

NP-hard

LearningFromData-Le ture16 10/20

(12)

RBF Networks Prototype Extraction

Aniterativealgorithm

Lloyd'salgorithm:Iterativelyminimize

X K k=1

X

x _n ∈S k

kx n − µ k k ²

^w.r.t.

µ k , S k

µ k ← 1

|S k | X

x n ∈S k

x n

S k ← {x n : kx n − µ k k ≤

^all

kx n − µ ℓ k}

Convergen e

−→

^lo
al ^minimum

LearningFromData-Le ture16 11/20

Aniterativealgorithm

Lloyd'salgorithm:Iterativelyminimize

X K k=1

X

x _n ∈S k

kx n − µ k k ²

^w.r.t.

µ k , S k

µ k ← 1

|S k | X

x n ∈S k

x n

S k ← {x n : kx n − µ k k ≤

^all

kx n − µ ℓ k}

Convergen e

−→

^lo
al ^minimum

LearningFromData-Le ture16 11/20

Aniterativealgorithm

Lloyd'salgorithm:Iterativelyminimize

X K k=1

X

x _n ∈ S _k

kx n − µ k k ²

^w.r.t.

µ k , S k

µ k ← 1

|S k | X

x n ∈S k

x n

S k ← {x n : kx n − µ k k ≤

^all

kx n − µ ℓ k}

Convergen e

−→

^lo
al ^minimum

LearningFromData-Le ture16 11/20

Aniterativealgorithm

Lloyd'salgorithm:Iterativelyminimize

X K k=1

X

x _n ∈ S _k

kx n − µ k k ²

^w.r.t.

µ k , S k

µ k ← 1

|S k | X

x n ∈S k

x n

S k ← {x n : kx n − µ k k ≤

^all

kx n − µ ℓ k}

Convergen e

−→

^lo
al ^minimum

LearningFromData-Le ture16 11/20

Aniterativealgorithm

Lloyd'salgorithm:Iterativelyminimize

X K k=1

X

x _n ∈ S _k

kx n − µ k k ²

^w.r.t.

µ k , S k

µ k ← 1

|S k | X

x n ∈S k

x n

S k ← {x n : kx n − µ k k ≤

^all

kx n − µ ℓ k}

Convergen e

−→

^lo
al ^minimum

LearningFromData-Le ture16 11/20

Aniterativealgorithm

Lloyd'salgorithm:Iterativelyminimize

X K k=1

X

x _n ∈ S _k

kx n − µ k k ²

^w.r.t.

µ k , S k

µ k ← 1

|S k | X

x n ∈S k

x n

S k ← {x n : kx n − µ k k ≤

^all

kx n − µ ℓ k}

Convergen e

−→

^lo
al ^minimum

LearningFromData-Le ture16 11/20

Aniterativealgorithm

Lloyd'salgorithm:Iterativelyminimize

X K k=1

X

x _n ∈ S _k

kx n − µ k k ²

^w.r.t.

µ k , S k

µ k ← 1

|S k | X

x n ∈S k

x n

S k ← {x n : kx n − µ k k ≤

^all

kx n − µ ℓ k}

Convergen e

−→

^lo
al ^minimum

LearningFromData-Le ture16 11/20

Aniterativealgorithm

Lloyd'salgorithm:Iterativelyminimize

X K k=1

X

x _n ∈ S _k

kx n − µ k k ²

^w.r.t.

µ k , S k

µ k ← 1

|S k | X

x n ∈S k

x n

S k ← {x n : kx n − µ k k ≤

^all

kx n − µ ℓ k}

Convergen e

−→

^lo
al ^minimum

LearningFromData-Le ture16 11/20

Aniterativealgorithm

Lloyd'salgorithm:Iterativelyminimize

X K k=1

X

x _n ∈ S _k

kx n − µ k k ²

^w.r.t.

µ k , S k

µ k ← 1

|S k | X

x n ∈S k

x n

S k ← {x n : kx n − µ k k ≤

^all

kx n − µ ℓ k}

Convergen e

−→

^lo
al ^minimum

LearningFromData-Le ture16 11/20

Aniterativealgorithm

Lloyd'salgorithm:Iterativelyminimize

X K k=1

X

x _n ∈ S _k

kx n − µ k k ²

^w.r.t.

µ k , S k

µ k ← 1

|S k | X

x n ∈S k

x n

S k ← {x n : kx n − µ k k ≤

^all

kx n − µ ℓ k}

Convergen e

−→

^lo
al ^minimum

LearningFromData-Le ture16 11/20

Aniterativealgorithm

Lloyd'salgorithm:Iterativelyminimize

X K k=1

X

x _n ∈ S _k

kx n − µ k k ²

^w.r.t.

µ k , S k

µ k ← 1

|S k | X

x n ∈S k

x n

S k ← {x n : kx n − µ k k ≤

^all

kx n − µ ℓ k}

Convergen e

−→

^lo
al ^minimum

LearningFromData-Le ture16 11/20

(13)

RBF Networks Prototype Extraction

Lloyd'salgorithm ina tion

Hi

Hi

1.Getthedatapoints

2.Onlytheinputs!

3.Initializethe enters

4.Iterate

5.Theseareyour

µ k

^'s

LearningFromData-Le ture16 12/20

Lloyd'salgorithm ina tion

Hi

Hi

1.Getthedatapoints

2.Onlytheinputs!

3.Initializethe enters

4.Iterate

5.Theseareyour

µ k

^'s

LearningFromData-Le ture16 12/20

Lloyd'salgorithm ina tion

Hi

Hi

1.Getthedatapoints

2.Onlytheinputs!

3.Initializethe enters

4.Iterate

5.Theseareyour

µ k

^'s

LearningFromData-Le ture16 12/20

Lloyd'salgorithm ina tion

Hi

Hi

1.Getthedatapoints

2.Onlytheinputs!

3.Initializethe enters

4.Iterate

5.Theseareyour

µ k

^'s

LearningFromData-Le ture16 12/20

Lloyd'salgorithm ina tion

Hi

Hi

1.Getthedatapoints

2.Onlytheinputs!

3.Initializethe enters

4.Iterate

5.Theseareyour

µ k

^'s

LearningFromData-Le ture16 12/20

Lloyd'salgorithm ina tion

Hi

Hi

1.Getthedatapoints

2.Onlytheinputs!

3.Initializethe enters

4.Iterate

5.Theseareyour

µ k

^'s

LearningFromData-Le ture16 12/20

Lloyd'salgorithm ina tion

Hi

Hi

1.Getthedatapoints

2.Onlytheinputs!

3.Initializethe enters

4.Iterate

5.Theseareyour

µ k

^'s

LearningFromData-Le ture16 12/20

Lloyd'salgorithm ina tion

Hi

Hi

1.Getthedatapoints

2.Onlytheinputs!

3.Initializethe enters

4.Iterate

5.Theseareyour

µ k

^'s

LearningFromData-Le ture16 12/20

Lloyd'salgorithm ina tion

Hi

Hi

1.Getthedatapoints

2.Onlytheinputs!

3.Initializethe enters

4.Iterate

5.Theseareyour

µ k

^'s

LearningFromData-Le ture16 12/20

Lloyd'salgorithm ina tion

Hi

Hi

1.Getthedatapoints

2.Onlytheinputs!

3.Initializethe enters

4.Iterate

5.Theseareyour

µ k

^'s

LearningFromData-Le ture16 12/20

Lloyd'salgorithm ina tion

Hi

Hi

1.Getthedatapoints

2.Onlytheinputs!

3.Initializethe enters

4.Iterate

5.Theseareyour

µ k

^'s

LearningFromData-Le ture16 12/20

Lloyd'salgorithm ina tion

Hi

Hi

1.Getthedatapoints

2.Onlytheinputs!

3.Initializethe enters

4.Iterate

5.Theseareyour

µ k

^'s

LearningFromData-Le ture16 12/20

Lloyd'salgorithm ina tion

Hi

Hi

1.Getthedatapoints

2.Onlytheinputs!

3.Initializethe enters

4.Iterate

5.Theseareyour

µ k

^'s

LearningFromData-Le ture16 12/20

Lloyd'salgorithm ina tion

Hi

Hi

1.Getthedatapoints

2.Onlytheinputs!

3.Initializethe enters

4.Iterate

5.Theseareyour

µ k

^'s

LearningFromData-Le ture16 12/20

Lloyd'salgorithm ina tion

Hi

Hi

1.Getthedatapoints

2.Onlytheinputs!

3.Initializethe enters

4.Iterate

5.Theseareyour

µ k

^'s

LearningFromData-Le ture16 12/20

(14)

RBF Networks Prototype Extraction

Fun Time

(15)

RBF Networks RBF Network

Choosingtheweights

X K k=1

w k exp

−γ kx n − µ k k ²

≈ y n N

^equationsⁱⁿ

K< N

^unknowns



 

 

exp( −γ kx 1 − µ 1 k ² ) . . . exp( −γ kx 1 − µ K k ² ) exp(−γ kx 2 − µ 1 k ² ) . . . exp(−γ kx 2 − µ K k ² )

.

.

.

.

.

.

.

.

.

exp(−γ kx N − µ 1 k ² ) . . . exp(−γ kx N − µ K k ² )



 

 

| {z }

Φ



 

  w 1

w 2

.

.

.

w K



 

 

| {z } w

≈



 

  y 1

y 2

.

.

.

y N



 

 

| {z } y

If

Φ

^T

Φ

^isinvertible,

w = (Φ

^T

Φ) ⁻¹ Φ

^T

y

pseudo-inverse

LearningFromData-Le ture16 14/20

Choosingtheweights

X K k=1

w k exp

−γ kx n − µ k k ²

= y n N

^equationsⁱⁿ

K< N

^unknowns



 

 

exp( −γ kx 1 − µ 1 k ² ) . . . exp( −γ kx 1 − µ K k ² ) exp(−γ kx 2 − µ 1 k ² ) . . . exp(−γ kx 2 − µ K k ² )

.

.

.

.

.

.

.

.

.

exp(−γ kx N − µ 1 k ² ) . . . exp(−γ kx N − µ K k ² )



 

 

| {z }

Φ



 

  w 1

w 2

.

.

.

w K



 

 

| {z } w

≈



 

  y 1

y 2

.

.

.

y N



 

 

| {z } y

If

Φ

^T

Φ

^isinvertible,

w = (Φ

^T

Φ) ⁻¹ Φ

^T

y

pseudo-inverse

LearningFromData-Le ture16 14/20

Choosingtheweights

X K k=1

w k exp

−γ kx n − µ k k ²

= y n N

^equationsⁱⁿ

K< N

^unknowns



 

 

exp( −γ kx 1 − µ 1 k ² ) . . . exp( −γ kx 1 − µ K k ² ) exp(−γ kx 2 − µ 1 k ² ) . . . exp(−γ kx 2 − µ K k ² )

.

.

.

.

.

.

.

.

.

exp(−γ kx N − µ 1 k ² ) . . . exp(−γ kx N − µ K k ² )



 

 

| {z }

Φ



 

  w 1

w 2

.

.

.

w K



 

 

| {z } w

≈



 

  y 1

y 2

.

.

.

y N



 

 

| {z } y

If

Φ

^T

Φ

^isinvertible,

w = (Φ

^T

Φ) ⁻¹ Φ

^T

y

pseudo-inverse

LearningFromData-Le ture16 14/20

Choosingtheweights

X K k=1

w k exp

−γ kx n − µ k k ²

= y n N

^equationsⁱⁿ

K< N

^unknowns



 

 

exp( −γ kx 1 − µ 1 k ² ) . . . exp( −γ kx 1 − µ K k ² ) exp(−γ kx 2 − µ 1 k ² ) . . . exp(−γ kx 2 − µ K k ² )

.

.

.

.

.

.

.

.

.

exp(−γ kx N − µ 1 k ² ) . . . exp(−γ kx N − µ K k ² )



 

 

| {z }

Φ



 

  w 1

w 2

.

.

.

w K



 

 

| {z } w

≈



 

  y 1

y 2

.

.

.

y N



 

 

| {z } y

If

Φ

^T

Φ

^isinvertible,

w = (Φ

^T

Φ) ⁻¹ Φ

^T

y

pseudo-inverse

LearningFromData-Le ture16 14/20

Choosingtheweights

X K k=1

w k exp

−γ kx n − µ k k ²

≈ y n N

^equationsⁱⁿ

K< N

^unknowns



 

 

exp( −γ kx 1 − µ 1 k ² ) . . . exp( −γ kx 1 − µ K k ² ) exp(−γ kx 2 − µ 1 k ² ) . . . exp(−γ kx 2 − µ K k ² )

.

.

.

.

.

.

.

.

.

exp(−γ kx N − µ 1 k ² ) . . . exp(−γ kx N − µ K k ² )



 

 

| {z }

Φ



 

  w 1

w 2

.

.

.

w K



 

 

| {z } w

≈



 

  y 1

y 2

.

.

.

y N



 

 

| {z } y

If

Φ

^T

Φ

^isinvertible,

w = (Φ

^T

Φ) ⁻¹ Φ

^T

y

pseudo-inverse

LearningFromData-Le ture16 14/20

Choosingtheweights

X K k=1

w k exp

−γ kx n − µ k k ²

≈ y n N

^equationsⁱⁿ

K< N

^unknowns



 

 

exp( −γ kx 1 − µ 1 k ² ) . . . exp( −γ kx 1 − µ K k ² ) exp(−γ kx 2 − µ 1 k ² ) . . . exp(−γ kx 2 − µ K k ² )

.

.

.

.

.

.

.

.

.

exp(−γ kx N − µ 1 k ² ) . . . exp(−γ kx N − µ K k ² )



 

 

| {z }

Φ



 

  w 1

w 2

.

.

.

w K



 

 

| {z } w

≈



 

  y 1

y 2

.

.

.

y N



 

 

| {z } y

If

Φ

^T

Φ

^isinvertible,

w = (Φ

^T

Φ) ⁻¹ Φ

^T

y

pseudo-inverse

LearningFromData-Le ture16 14/20

Choosingtheweights

X K k=1

w k exp

−γ kx n − µ k k ²

≈ y n N

^equationsⁱⁿ

K< N

^unknowns



 

 

exp( −γ kx 1 − µ 1 k ² ) . . . exp( −γ kx 1 − µ K k ² ) exp(−γ kx 2 − µ 1 k ² ) . . . exp(−γ kx 2 − µ K k ² )

.

.

.

.

.

.

.

.

.

exp(−γ kx N − µ 1 k ² ) . . . exp(−γ kx N − µ K k ² )



 

 

| {z }

Φ



 

  w 1

w 2

.

.

.

w K



 

 

| {z } w

≈



 

  y 1

y 2

.

.

.

y N



 

 

| {z } y

If

Φ

^T

Φ

^isinvertible,

w = (Φ

^T

Φ) ⁻¹ Φ

^T

y

pseudo-inverse

LearningFromData-Le ture16 14/20

Choosingtheweights

X K k=1

w k exp

−γ kx n − µ k k ²

≈ y n N

^equationsⁱⁿ

K< N

^unknowns



 

 

exp( −γ kx 1 − µ 1 k ² ) . . . exp( −γ kx 1 − µ K k ² ) exp(−γ kx 2 − µ 1 k ² ) . . . exp(−γ kx 2 − µ K k ² )

.

.

.

.

.

.

.

.

.

exp(−γ kx N − µ 1 k ² ) . . . exp(−γ kx N − µ K k ² )



 

 

| {z }

Φ



 

  w 1

w 2

.

.

.

w K



 

 

| {z } w

≈



 

  y 1

y 2

.

.

.

y N



 

 

| {z } y

If

Φ

^T

Φ

^isinvertible,

w = (Φ

^T

Φ) ⁻¹ Φ

^T

y

pseudo-inverse

LearningFromData-Le ture16 14/20

Choosingtheweights

X K k=1

w k exp

−γ kx n − µ k k ²

≈ y n N

^equationsⁱⁿ

K< N

^unknowns



 

 

exp( −γ kx 1 − µ 1 k ² ) . . . exp( −γ kx 1 − µ K k ² ) exp(−γ kx 2 − µ 1 k ² ) . . . exp(−γ kx 2 − µ K k ² )

.

.

.

.

.

.

.

.

.

exp(−γ kx N − µ 1 k ² ) . . . exp(−γ kx N − µ K k ² )



 

 

| {z }

Φ



 

  w 1

w 2

.

.

.

w K



 

 

| {z } w

≈



 

  y 1

y 2

.

.

.

y N



 

 

| {z } y

If

Φ

^T

Φ

^isinvertible,

w = (Φ

^T

Φ) ⁻¹ Φ

^T

y

pseudo-inverse

LearningFromData-Le ture16 14/20

Choosingtheweights

X K k=1

w k exp

−γ kx n − µ k k ²

≈ y n N

^equationsⁱⁿ

K< N

^unknowns



 

 

exp( −γ kx 1 − µ 1 k ² ) . . . exp( −γ kx 1 − µ K k ² ) exp(−γ kx 2 − µ 1 k ² ) . . . exp(−γ kx 2 − µ K k ² )

.

.

.

.

.

.

.

.

.

exp(−γ kx N − µ 1 k ² ) . . . exp(−γ kx N − µ K k ² )



 

 

| {z }

Φ



 

  w 1

w 2

.

.

.

w K



 

 

| {z } w

≈



 

  y 1

y 2

.

.

.

y N



 

 

| {z } y

If

Φ

^T

Φ

^isinvertible,

w = (Φ

^T

Φ) ⁻¹ Φ

^T

y

pseudo-inverse

LearningFromData-Le ture16 14/20

Choosingtheweights

X K k=1

w k exp

−γ kx n − µ k k ²

≈ y n N

^equationsⁱⁿ

K< N

^unknowns



 

 

exp( −γ kx 1 − µ 1 k ² ) . . . exp( −γ kx 1 − µ K k ² ) exp(−γ kx 2 − µ 1 k ² ) . . . exp(−γ kx 2 − µ K k ² )

.

.

.

.

.

.

.

.

.

exp(−γ kx N − µ 1 k ² ) . . . exp(−γ kx N − µ K k ² )



 

 

| {z }

Φ



 

  w 1

w 2

.

.

.

w K



 

 

| {z } w

≈



 

  y 1

y 2

.

.

.

y N



 

 

| {z } y

If

Φ

^T

Φ

^isinvertible,

w = (Φ

^T

Φ) ⁻¹ Φ

^T

y

pseudo-inverse

LearningFromData-Le ture16 14/20

參考文獻

立即下載 ( PDF - 25 頁 - 7.86 MB )

相關文件

Machine Learning Techniques (ᘤᢈ)

Principle Component Analysis Denoising Auto Encoder Deep Neural Network... Deep Learning Optimization

Machine Learning Techniques (ᘤᢈ)

Which of the following aggregation model learns diverse g t by reweighting and calculates linear vote by steepest search?.

Machine Learning Foundations (ᘤ9M)

Hsuan-Tien Lin (NTU CSIE) Machine Learning Foundations 16/22.. If we use E loocv to estimate the performance of a learning algorithm that predicts with the average y value of the

Machine Learning Techniques (ᘤᢈ)

3 Distilling Implicit Features: Extraction Models Lecture 14: Radial Basis Function Network. RBF

Machine Learning Techniques (ᘤᢈ)

Lecture 4: Soft-Margin Support Vector Machine allow some margin violations ξ n while penalizing them by C; equivalent to upper-bounding α n by C Lecture 5: Kernel Logistic

Machine Learning Techniques (ᘤᢈ)

Hsuan-Tien Lin (NTU CSIE) Machine Learning Techniques 5/22.. Decision Tree Decision Tree Hypothesis. Disclaimers about

Machine Learning Techniques (ᘤᢈ)

1 Embedding Numerous Features: Kernel Models Lecture 1: Linear Support Vector Machine.. linear SVM: more robust and solvable with quadratic programming Lecture 2: Dual Support

Machine Learning Techniques (ᘤᢈ)

1 Embedding Numerous Features: Kernel Models Lecture 1: Linear Support Vector Machine.

上傳您的學習材料以下載所有文件。

您的文件將被豐富，在 9lib TW 上共享以幫助學習。

相關文件

Machine Learning Techniques (ᘤᢈ)

Machine Learning Techniques (ᘤᢈ)

31

0

0

Machine Learning Techniques (ᘤᢈ)

Machine Learning Techniques (ᘤᢈ)

147

0

0

Machine Learning Techniques (ᘤᢈ)

Machine Learning Techniques (ᘤᢈ)

153

0

0

Machine Learning Techniques (ᘤᢈ)

Machine Learning Techniques (ᘤᢈ)

28

0

0

Machine Learning Techniques (ᘤᢈ)

Machine Learning Techniques (ᘤᢈ)

126

0

0

Machine Learning Techniques (ᘤᢈ)

Machine Learning Techniques (ᘤᢈ)

26

0

0

Machine Learning Techniques (ᘤᢈ)

Machine Learning Techniques (ᘤᢈ)

112

0

0

Machine Learning Techniques (ᘤᢈ)

Machine Learning Techniques (ᘤᢈ)

37

0

0