PlattSMO算法的完整实现需要大量代码。在接下来的第一个例子中，我们将会对算法进行简化处理，以便了解算法的基本工作思路，之后再基于简化版给出完整版。简化版代码虽然量少

但执行速度慢。Platt SMO算法中的外循环确定要优化的最佳alpha对。而简化版却会跳过这一部分，首先在数据集上遍历每一个8也^ , 然后在剩下的3妙 3集合中随机选择另一个3妙 3’从而构建alpha对。这里有一点相当重要，就是我们要同时改变两个3中1^ 。之所以这样做是因为我们有一个约束条件：

[a , ■ label(,) = 0

由于改变一个邮^ 可能会导致该约束条件失效，因此我们总是同时改变两个3中 ^ 。

① John C. Platt, “Using Analytic QP and Sparseness to Speed Training of Support Vector Machines” \nAdvances in Neural Information Processing Systems 11，M. S. Kearns, S. A. Solla, D. A. Cohn, eds(MIT Press, 1999), 557~63.

6.3 S M O

高效优化算法

95

96

第

6

章支持向量机

6,3 S M O

高效优化算法

97

98

^第

6

章支持向量机

需要退出_{^ ^}循环的当前迭代过程。该过程对真实_SMO算法进行了简化处理。如果_{& £1}为₀,那么计算新的3 1 ? 1 ^鬥]就比较麻烦了，这里我们就不对此进行详细的介绍了。有需要的读者可以阅读朽故的原文来了解更多的细节。现实中，这种情况并不常发生，因此忽略这一部分通常也无伤大雅。于是，可以计算出一个新的_&均_{1 ^ [}幻，然后利用程序清单_{6 - l}中的辅助函数以及_L与_H值对其进行调整。

然后，就是需要检查

31£^3[

」

]

是否有轻微改变。如果是的话，就退出化匸循环。然后，

31

卩匕

3[1]

和

319

匕

3[

」

]

同样进行改变，虽然改变的大小一样，但是改变的方向正好相反（即如果一个增加，那么另外一个减少）

€1

。在对

3191^[1]

和

31

口

1^[

」

]

进行优化之后，给这两个

31

。匕

3

值设置一个常数项

b © o

最后，在优化过程结束的同时，必须确保在合适的时机结束循环。如果程序执行到££^ 循环的最后一行都不执行

<^

址

^

此语句，那么就已经成功地改变了一对

&

中匕，同时可以增加

alphaPairsChanged

的值。在卩

01^|

环之外，需要检査

8

如

1^

值是否做了更新，如果有更新则将丄七

6 3 5

为

0

后继续运行程序。只有在所有数据集上遍历

maxIter

次，且不再发生任何

3

丨?仏修改之后，程序才会停止并退出

^^116

循环。

为了解实际效果，可以运行如下命令:

>>> b , a l p h a s = s v m M L i A . s m o S i m p l e (dataArr, labe l A r r , 0 . 6, 0.001, 40)

运行后输出类似如下结果：

i t e r a t i o n n u m b e r ： 29 j n o t m o v i n g e n o u g h i t e r a t i o n n u m b e r ： 30

i t e r : 30 i:17, p a i r s c h a n g e d 1 j n o t m o v i n g e n o u g h

i t e r a t i o n n u m b e r ： 0 j n o t m o v i n g e n o u g h i t e r a t i o n n u m b e r ： 1

上述运行过程需要几分钟才会收敛。一旦运行结束，我们可以对结果进行观察：

>>> b

m a t r i x ( [ [ - 3 . 8 4 0 6 4 4 1 3 ] ] )

我们可以直接观察&咕“ 矩阵本身，但是其中的零元素太多。为了观察大于0的元素的数量，可以

输入如下命令： ,

>>> a l p h a s [alphas>0]

m a t r i x ( [[ 0 . 1 2 7 3 5 4 1 3 , 0 . 2 4 1 5 4 7 9 4 , 0 . 3 6 8 9 0 2 0 8 ] ] )

由于

8^«)

算法的随机性，读者运行后所得到的结果可能会与上述结果不同。

alphas [31

口

1^3>0]

命令是数组过滤（

arrayfiltering)

的一个实例，而且它只对

1^

通

?7

类型有用，却并不适用于口

>^0)1

中的正则表

(regular list )0

如果输人

3

如

1 ^ > 0 ,

那么就会得到一个布尔数组，

并且在不等式成立的情况下，其对应值为正确的。于是，在将该布尔数组应用到原始的矩阵当中时，就会得到一个灿

0

办矩阵，并且其中矩阵仅仅包含大于

0

的值。

为了得到支持向量的个数，输人：

6 . 4

利用完整

Platt SM O

算法加速优化

99

>>> s h a p e ( a l p h a s [alphas>0])

为了解哪些数据点是支持向量，输入：

>>> f o r i in r a n g e (100) ：

... if a l p h a s [i]> 0 . 0 ： p r i n t d a t a A r r [ i ] ,labe l A r r [ i ]

得到的结果类似如下：

[ 4 . 6 5 8 1 9 1 0 0 0 0 0 0 0 0 0 4 , 3 . 507396] -1.0

[ 3 . 4 5 7 0 9 5 9 9 9 9 9 9 9 9 9 9 , - 0 . 0 8 2 2 1 5 9 9 9 9 9 9 9 9 9 9 9 7 ] -1.0 [ 6 . 0 8 0 5 7 3 0 0 0 0 0 0 0 0 0 2 , 0 . 4 1 8 8 8 5 9 9 9 9 9 9 9 9 9 9 8 ] 1.0

在原始数据集上对这些支持向量画圈之后的结果如图

6-4

所示。

用圆圈标记的支持向量

图

6 - 4

示例数据集上运行简化版

8 ^ »

算法后得到的结果，包括画圈的支持向量与分隔超平面利用前面的设置，我运行了

10

次程序并取其平均时间。结果是，这个过程在一台性能较差的笔记本上需要

14.5

秒。虽然结果看起来并不是太差，但是别忘了这只是一个仅有

100

个点的小规模数据集而已。在更大的数据集上，收敛时间会变得更长。在下一节中

’

我们将通过构建完整

3

厘

0

算法来加快其运行速度。

6 . 4 利用完整卩丨3 « 3 " 0 算法加速优化

在几百个点组成的小规模数据集上，简化版

S M O

算法的运行是没有什么问题的，但是在更大的数据集上的运行速度就会变慢。刚才巳经讨论了简化版

S M O

算法，下面我们就讨论完整版的

PlattSMO

算法。在这两个版本中，实现

&1

沖

3

的更改和代数运算的优化环节一模一样。在优化过程中，唯一的不同就是选择

31?1^

的方式。完整版的

Plat t S M O

算法应用了一些能够提速的启发方法。或许读者已经意识到，上一节的例子在执行时存在一定的时间提升空间。

Platt 3

厘

0

算法是通过一个外循环来选择第一个

&4 ^

值的，并且其选择过程会在两种方式之间进行交替：一种方式是在所有数据集上进行单遍扫描，另一种方式则是在非边界

3

化^中实现单

100

第

6

章支持向量机

6 . 4

利用完整？

13« 8

\ « ) 算法加速优化

101

首要的事情就是建立一个数据结构来保存所有的重要值，而这个过程可以通过一个对象来完成。这里使用对象的目的并不是为了面向对象的编程，而只是作为一个数据结构来使用对象。在将值传给函数时，我们可以通过将所有数据移到一个结构中来实现，这样就可以省掉手工输人的麻烦了。而此时，数据就可以通过一个对象来进行传递。实际上，当完成其实现时，可以很容易 通过 ? 7 出011的字典来完成。但是在访问对象成员变量时，这样做会有更多的手工输人操作，对比 一下 1 ^ 0 紀 6 ^ 乂和0 ^ 0 的 6 < ^ [ 1 ，]就可以知道这一点。为达到这个目的，需要构建一个仅包含 土1 ^ 七方法的 0 ^ ^ 3 七1 ^ 比 _ 。该方法可以实现其成员变量的填充。除了增加了一个 0 ^ 2 的矩阵成 员变量 0 0 & 池 6 之外 0 ，这些做法和简化版 S M O — 模一样。 6 0 3 比 6 的第一列给出的是 6 0 3 比 6 是 否有效的标志位，而第二列给出的是实际的 £ 值。

PlattSMO算法的完整实现需要大量代码。在接下来的第一个例子中，我们将会对算法进行 简化处理，以便了解算法的基本工作思路，之后再基于简化版给出完整版。简化版代码虽然量少

[a , ■ label(,) = 0

6.3 S M O

95

96

6

6,3 S M O

97

98

6

31£^3[

]

31

3[1]

319

3[

]

€1

3191^[1]

31

1^[

]

31

3

b © o

<^

^

&

alphaPairsChanged

01^|

8

1^

6 3 5

0

maxIter

3

^^116

8^«)

alphas [31

1^3>0]

arrayfiltering)

1^

?7

>^0)1

(regular list )0

3

1 ^ > 0 ,

0

0

6 . 4

Platt SM O

99

6-4

6 - 4

8 ^ »

10

14.5

100

’

3

0

6 . 4 利用完整卩丨3 « 3 " 0 算法加速优化

S M O

S M O

PlattSMO

&1

3

31?1^

Plat t S M O

Platt 3

0

&4 ^

3

100

6

6 . 4

13« 8

101

对于给定的

肿 通 ，第一个辅助函数

PlattSMO算法的完整实现需要大量代码。在接下来的第一个例子中，我们将会对算法进行简化处理，以便了解算法的基本工作思路，之后再基于简化版给出完整版。简化版代码虽然量少

肿通，第一个辅助函数

算法中出现频繁，这里必须要将其单独拎出来。