import numpy as np
import matplotlib.pyplot as plt

ver = "B"

data = np.genfromtxt("p1-%s.csv"%ver, delimiter=",")


### your code to reach the answer
data = np.genfromtxt("p1-%s.csv"%ver, delimiter=",")

from sklearn.decomposition import PCA
model = PCA(2)
X_new = model.fit_transform(data)

plt.axis("equal")
plt.scatter(*X_new.T)

<matplotlib.collections.PathCollection at 0x7fa12ba81180>

dist = np.genfromtxt("p2-%s.csv"%ver, delimiter=",")


### your code to reach the answer
dist = np.genfromtxt("p2-%s.csv"%ver, delimiter=",")

from sklearn.manifold import MDS
model = MDS(dissimilarity="precomputed")
X_new = model.fit_transform(dist)

plt.axis("equal")
plt.scatter(*X_new.T)

<matplotlib.collections.PathCollection at 0x7fa12b99cc70>

X = np.genfromtxt("p3-%s.csv"%ver, delimiter=",")
y = np.array([0]*50 + [1]*50 + [2]*50 + [3]*50)
w = np.array([0,0,0,0])


### your code to reach the answer
X = np.genfromtxt("p3-%s.csv"%ver, delimiter=",")
y = np.array([0]*50 + [1]*50 + [2]*50 + [3]*50)
w = np.array([0,0,0,0])

centers = np.zeros((4,X.shape[1]))
for i in range(4):
    centers[i] = X[y == i].mean(axis=0)
    
dist = np.sqrt(np.sum((centers - w) ** 2, axis=1))
dist.argmin()

1

X = np.genfromtxt("p4-%s.csv"%ver, delimiter=",")


### your code to reach the answer
X = np.genfromtxt("p4-%s.csv"%ver, delimiter=",")

from sklearn.cluster import DBSCAN
model = DBSCAN()
y_new = model.fit_predict(X)

np.where(y_new == -1)

(array([648]),)

data = np.genfromtxt("p5-%s.csv"%ver, delimiter=",")
x,y = data.T


### your code to reach the answer
data = np.genfromtxt("p5-%s.csv"%ver, delimiter=",")
x,y = data.T

np.sum((3 + 4*x - y)**2)

0.6588026544945301

data = np.genfromtxt("p6-%s.csv"%ver, delimiter=",")
x,y = data.T


### your code to reach the answer
data = np.genfromtxt("p6-%s.csv"%ver, delimiter=",")
x,y = data.T

X = x[:,np.newaxis] ** np.array([2,4])
from sklearn.linear_model import LinearRegression
model = LinearRegression(fit_intercept=False)
model.fit(X, y)
model.coef_

array([ 4.00031613, -1.0000116 ])

path = "p7-%s"%ver


### your code to reach the answer
path = "p7-%s"%ver

import os
from PIL import Image
X = np.zeros((100, 28, 28), dtype=int)
for j in range(100):
    img = Image.open(os.path.join(path, "digit%02d.png"%j))
    X[j] = np.array(img)
X_flat = X.reshape(100, 28*28)
y = np.array([0]*50 + [1]*50)

img = Image.open(os.path.join(path, "blur.png"))
blur = np.array(img)
blur_flat = blur.reshape(1, 28*28)

from sklearn.neighbors import KNeighborsClassifier 
model = KNeighborsClassifier(5)
model.fit(X_flat, y)
y_new = model.predict(blur_flat)
y_new

array([0])

y = np.genfromtxt("p8-%s.csv"%ver, delimiter=",")


### your code to reach the answer
y = np.genfromtxt("p8-%s.csv"%ver, delimiter=",")

dtrib = np.unique(y, return_counts=True)[1]
prob = dtrib / dtrib.sum()
np.sum(prob * (1 - prob))

0.56

X = np.genfromtxt("p9-%s.csv"%ver, delimiter=",")


### your code to reach the answer
X = np.genfromtxt("p9-%s.csv"%ver, delimiter=",")

from sklearn.cluster import KMeans

inertias = []
for k in range(1,11):
    model = KMeans(k)
    model.fit(X)
    inertias.append(model.inertia_)
    
plt.plot(np.arange(1,11), inertias)

[<matplotlib.lines.Line2D at 0x7fa12b4baa40>]

X = np.genfromtxt("p10-%s.csv"%ver, delimiter=",")


### your code to reach the answer
X = np.genfromtxt("p10-%s.csv"%ver, delimiter=",")

radii = np.sqrt(np.sum(X**2, axis=1))[:,np.newaxis]
from sklearn.cluster import KMeans
model = KMeans(3)
model.fit(radii)

model.cluster_centers_

array([[2.        ],
       [1.41421356],
       [2.44948974]])


### points for each problem
pts = [0,0,0,0,0, 
       0,0,0,0,0, 
       0]
total = sum(pts)
print("Your total score =", total)

Math599 2022S¶

ML-exam¶

Problem 1 [2pt]¶

Problem 2 [2pt]¶

Problem 3 [2pt]¶

Problem 4 [2pt]¶

Problem 5 [2pt]¶

Problem 6 [2pt]¶

Problem 7 [2pt]¶

Problem 8 [2pt]¶

Problem 9 [2pt]¶

Problem 10 [2pt]¶

Problem 11 [extra 2pt]¶