%load_ext autoreload
%autoreload 2
from svm import *
import numpy as np
from numpy import testing
import matplotlib.pyplot as plt
plt.rc('axes', axisbelow=True)

Xi = np.array([[0, 1],
               [1, -1]])
Xj = np.array([[2, 1.5, -1.1],
               [-1, 0,  3]])

K = get_kernel(Xi, Xj, {'kernel': 'linear'})
print(K)
testing.assert_allclose(K, [[-1., 0., 3.],
                            [3., 1.5, -4.1]],
                        err_msg='The kernel values incorrect.')

[[-1.   0.   3. ]
 [ 3.   1.5 -4.1]]

K = get_kernel(Xi, Xj, {'kernel': 'polynomial', 'd': 2})
testing.assert_allclose(K, [[0., 1., 16.],
                            [16., 6.25, 9.61]],
                        err_msg='The kernel values incorrect.')

K = get_kernel(Xi, Xj, {'kernel': 'polynomial', 'd': 5})
with np.printoptions(precision=4, suppress=True):
    print(K)
testing.assert_allclose(K, [[0., 1., 1024.],
                            [1024., 97.6562, -286.2915]],
                        err_msg='The kernel values incorrect.', atol=1e-4)

[[   0.        1.     1024.    ]
 [1024.       97.6562 -286.2915]]

K = get_kernel(Xi, Xj, {'kernel': 'rbf', 'sigma': 2.0})
testing.assert_allclose(K, [[0.367879, 0.666144, 0.521394],
                            [0.882497, 0.855345, 0.077984]],
                        err_msg='The kernel values incorrect.', atol=1e-4)

X = np.array([[1, 2, 1, -1, -1, -2],
              [1, 1, 2, -1, -2, -1]])
y = np.array([-1, 1, 1, 1, -1, -1])
C = 0.1
options = {'verb': True, 
           't_max': float('inf'),
           'kernel': 'linear'}

model = svm(X, y, C, options)

testing.assert_allclose(model['sv'], [[1, 2, 1, -1, -1, -2],
                                      [1, 1, 2, -1, -2, -1]],
                        err_msg='Support vectors incorrect.')
testing.assert_allclose(model['y'], [-1, 1, 1, 1, -1, -1], err_msg='Support vector labels incorrect.')
testing.assert_allclose(model['alpha'], [0.1, 0.1, 0.07777778, 0.1, 0.1, 0.07777778], err_msg='Alphas incorrect.')
testing.assert_allclose(model['b'], 0.0, err_msg='Bias incorrect.')

classif = classif_svm(X, model)
testing.assert_allclose(classif, [1, 1, 1, -1, -1, -1], err_msg='Classification incorrect.')

plt.gca().set_aspect("equal")
plt.xlim(-3, 3)
plt.ylim(-3, 3)
plot_boundary(plt.gca(), model)
plot_points(X, y)
plt.title('first SVM')
plt.savefig('first_svm.png', dpi=300)

data = np.load("data_svm1.npz", allow_pickle=True)
X_toy = data["X"]
y_toy = data["y"]

C = np.inf
options = {'verb': False, 
           't_max': float('inf'),
           'kernel': 'linear'}
model = svm(X_toy, y_toy, C, options=options)
plot_points(X_toy, y_toy)
plot_boundary(plt.gca(), model)
plt.gca().set_aspect("equal")
plt.title('hard-margin SVM, C = {}'.format(C))
plt.savefig('linear_svm_hard_margin.png', dpi=300)

C = 1
options = {'verb': False, 
           't_max': float('inf'),
           'kernel': 'linear'}
model = svm(X_toy, y_toy, C, options=options)
plot_points(X_toy, y_toy)
plot_boundary(plt.gca(), model)
plt.gca().set_aspect("equal")
plt.title('SVM, C = {}'.format(C))
plt.savefig('linear_svm.png', dpi=300)

try:
    from ipywidgets import interact, interactive, fixed

    @interact(C=(0.001,100.,0.001))
    def soft_margin(C=1):
        model = svm(X_toy, y_toy, C, options={'verb': False,
                                              't_max': float('inf'),
                                              'kernel': 'linear'})
        plt.gca().set_aspect("equal")
        plot_points(X_toy, y_toy)
        plot_boundary(plt.gca(), model)
        plt.title('Soft-margin SVM, C = {}'.format(C));

except ImportError:
    print('Optional feature.')

interactive(children=(FloatSlider(value=1.0, description='C', min=0.001, step=0.001), Output()), _dom_classes=…

data = np.load("flower.npz", allow_pickle=True)
X_flower = data["X"]
y_flower = data["y"]
C = 10

options = {'verb': False, 
           't_max': float('inf'),
           'kernel': 'linear'}

model = svm(X_flower, y_flower, C, options)

plot_points(X_flower, y_flower)
plot_boundary(plt.gca(), model)
plt.title('linear kernel')
plt.gca().set_aspect("equal")
plt.savefig('flower_linear.png', dpi=300)

sigma = 0.1
options = {'verb': False, 
           't_max': float('inf'),
           'kernel': 'rbf', 
           'sigma': sigma}

model = svm(X_flower, y_flower, C, options)

plot_points(X_flower, y_flower)
plot_boundary(plt.gca(), model)
plt.title('RBF kernel $\sigma$={}'.format(sigma))
plt.gca().set_aspect("equal")
plt.savefig('flower_rbf.png', dpi=300)

d = 15
options = {'verb': False, 
           't_max': float('inf'),
           'kernel': 'polynomial', 
           'd': d}

model = svm(X_flower, y_flower, C, options)

plot_points(X_flower, y_flower)
plot_boundary(plt.gca(), model)
plt.title('polynomial kernel d={}'.format(d))
plt.gca().set_aspect("equal")
plt.savefig('flower_polynomial.png', dpi=300)

trn_data = {'images': np.array(
    [[[5, 0],
      [3, 0]],
     [[10, 8],
      [0, 0]]]).transpose(1, 2, 0),  # NxHxW -> HxWxN
            'labels': np.array([1, -1])
            }
X_trn, y_trn, norm_trn = compute_measurements_2d(trn_data)
np.testing.assert_array_almost_equal(X_trn, np.array([[1, -1],
                                                      [-1, 1]]))
np.testing.assert_array_almost_equal(y_trn, np.array([1, -1]))
np.testing.assert_almost_equal(norm_trn['lr_mean'], 5.0)
np.testing.assert_almost_equal(norm_trn['lr_std'], 3.0)
np.testing.assert_almost_equal(norm_trn['ud_mean'], 10.0)
np.testing.assert_almost_equal(norm_trn['ud_std'], 8.0)

tst_data = {'images': np.array(
    [[[5, 0],
      [3, 0]]]).transpose(1, 2, 0),  # NxHxW -> HxWxN
            'labels': np.array([1])}
X_tst, y_tst, _ = compute_measurements_2d(tst_data, norm_trn)
np.testing.assert_array_almost_equal(X_tst[:, 0], X_trn[:, 0])

data = np.load("data_svm1_images.npz", allow_pickle=True)
trn_data = data["trn"].item()
tst_data = data["tst"].item()

X_trn, y_trn, norm_trn = compute_measurements_2d(trn_data)
X_tst, y_tst, _ = compute_measurements_2d(tst_data, norm_trn)

np.random.seed(42)
trn_folds, tst_folds = crossval(y_trn.size, num_folds=4)

Cs = [0.001, 0.1, 1, 10]
ds = [1, 3, 5]

best_params = None
best_err = np.inf
for C in Cs:
    for d in ds:
        options = {'verb': False, 't_max': 100000,
                   'kernel': 'polynomial', 'd': d}
        err = svm_crossvalidation(trn_folds, tst_folds, X_trn, y_trn, C, options)

        if err < best_err:
            best_err = err
            best_params = (C, d)
        print('C {}, d {} -> err {}'.format(C, d, err))

print('best params: C={}, d={}'.format(best_params[0], best_params[1]))

C = best_params[0]
d = best_params[1]

options = {'verb': False, 
           't_max': float('inf'),
           'kernel': 'polynomial', 
           'd': d}
model = svm(X_trn, y_trn, C, options)

plot_points(X_trn, y_trn, size=2)
plot_boundary(plt.gca(), model, plot_support_vectors=False)
plt.gca().set_aspect("equal")
plt.grid(linestyle='--')
plt.title('Polynomial kernel $d$={} TRN data'.format(d))
plt.savefig('ocr_polynomial_kernel_trn.png', dpi=300)

classif = classif_svm(X_tst, model)

err = np.mean(classif != y_tst)
print(f'test set error: {err}')

plt.gca().set_aspect("equal")
plot_points(X_tst, y_tst, size=5)
plt.gca().relim()
plt.grid(linestyle='--')
plt.title('Polynomial kernel $d$={} TST data'.format(d))
plot_boundary(plt.gca(), model, plot_support_vectors=False)
plt.savefig('ocr_polynomial_kernel_tst.png')

test set error: 0.045

labels = classif.copy()
labels[labels == 1] = 0
labels[labels == -1] = 1

plt.figure(figsize=(15,10))
show_classification(tst_data['images'], labels, 'AC')
plt.savefig('ocr_svm_classif.png', dpi=300)

data = np.load("mnist_trn.npz", allow_pickle=True)
X_trn = data['X']
y_trn = data['y']

data = np.load("mnist_tst.npz", allow_pickle=True)
X_tst = data['X']
y_tst = data['y']

np.random.seed(42)
trn_folds, tst_folds = crossval(y_trn.size, num_folds=5)
sigmas = [0.1, 1, 10, 20, 100, 1000]
Cs = [0.01, 0.1, 1, 10]

best_params = None
best_err = np.inf
for C in Cs:
    for sigma in sigmas:
        options = {'verb': False, 't_max': float('inf'),
                   'kernel': 'rbf', 'sigma': sigma}
        err = svm_crossvalidation(trn_folds, tst_folds, X_trn, y_trn, C, options)

        if err < best_err:
            best_err = err
            best_params = (C, sigma)
        print('C {}, sigma {} -> err {}'.format(C, sigma, err))

print('best params: C={}, sigma={}'.format(best_params[0], best_params[1]))

C = best_params[0]
sigma = best_params[1]

options = {'verb': False, 't_max': float('inf'),
           'kernel': 'rbf', 'sigma': sigma}
model = svm(X_trn, y_trn, C, options)

prediction = classif_svm(X_tst, model)
err = np.mean(prediction != y_tst)
print(f'test set error: {err}')

plt.figure(figsize=(15,10))
show_classification(X_tst.reshape(28,28,-1), prediction > 0, '01')
plt.savefig('mnist_tst_classif.png', dpi=300)

test set error: 0.0

show_classification(model['sv'].reshape(28, 28, -1), model['y'] > 0, '01')
plt.savefig('mnist_support_vectors.png')

Support Vector Machines (SVM)¶

SVM task¶

Interactive demo¶

SVM task in dual form¶

Kernel function¶

Linear kernel¶

Polynomial kernel¶

RBF kernel¶

SVM implementation¶

Hard-margin vs soft-margin SVM¶

Kernel SVM¶

SVM for letter classification¶

Feature normalization¶

Hyper-parameter selection¶

SVM for MNIST digit classification¶

Submission to the BRUTE Upload System¶

Bonus task¶