.css-1vyo7ug{position:fixed;bottom:0;left:0;margin-left:0.5rem;margin-bottom:0.5rem;display:-webkit-inline-box;display:-webkit-inline-flex;display:-ms-inline-flexbox;display:inline-flex;box-shadow:0 1px 3px 0 rgba(0,0,0,0.1),0 1px 2px 0 rgba(0,0,0,0.06);-webkit-align-items:center;-webkit-box-align:center;-ms-flex-align:center;align-items:center;border-radius:0.25rem;--text-opacity:1;color:rgba(255,255,255,var(--text-opacity));font-size:0.875rem;font-weight:700;padding-left:1rem;padding-right:1rem;padding-top:0.75rem;padding-bottom:0.75rem;background-color:#86a8e7;z-index:9999;}

Please enable JavaScript to use this site.
JavaScript를 활성화 시켜주세요.

Week 1 Table of Contents

2021-08-07

TOC

References

Lecture 1 | Vectors

Image Reference

What is Vector
Distance between two vectors
Angle between two vectors
Vector's Norm
- L1 Norm
- L2 Norm
Vector's Dot Product
- same as Inner Product, Dot Product, Scalar Product, projection product
Vector's Orthogonality
Vector's Projection

Lecture 2 | Linear Algebra

Lang's Linear algebra or Introduction to linear algebra for an undergraduate - Mathematics Educators Stack Exchange

What is Matrix
Matrix Operations: Addition, Multiplication
Spaces of Vectors
Inverse Matrices
Pseudo-inverse matrices (same as Moore-Penrose Matrix)

Lecture 3,4 | Gradient Descent

Differentiation
Gradient Ascent & Gradient Descent
Gradient Descent in Code
Nabla & Partial Differentiation for vectors
Gradient Vectors
Linear Regression and pseudoinverse
Getting beta's minimum using linear regression gradient descent
Limitations of Gradient Descent

Lecture 4 | Stochastic Gradient Descent(SGD)

Stochastic Gradient Descent for non-convex functions
Minibatch SGD

Lecture 5 | Deep Learning

Non-linear neural network
softmax
activation function - sigmoid, tanh(hyperbolic tangent), ReLU
Multi-layer perceptron
Forward Propogation
Backpropogation
Gradient vectors and chain rules

Lecture 6 | Probabilities

Loss function
Probability distributions
Discrete Random Variable, Probability Mass Function
Continuous Random Variable, Probability Distribution Function
Conditional Probability
Expectations
Variance, Covariance, SKewness
Monte Carlo Sampling Method

Lecture 7 | Statistical Inference

Probability Distribution
Sample Mean, Sample Variance
Sampling Distribution
Maximum Likelihood Estimation(MLE)
Log-likelihood, Negative log-likelihood
Sample MLE
MLE Estimation
KL Divergence
Cross Entropy
Entropy

Lecture 8 | Bayesian Statistics

Posterial, Prior, Evidence, Likelihood
True Positive and Recall Rate
False Negative
True Negative and Specificty
False Positive
Precision

Lecture 9 | Convolutional Neural Network(CNN)

MLP vs CNN
Kernal(same as Weight Matrix, Filters, Window)
1D Conv
2D Conv
3D Conv
- 3D Conv are 2D conv stacked up as 3 Channels
- Tensors are stacked matrices as much as 3 Channels
Backpropogation in Convolution

Lecture 10 | Recurrent Neural Network(RNN)

Sequential Data
Conditional Probability
Backpropagation Through Time (BPTT)
Truncated BPTT
LSTM, GRU

Previous Post

Professor-Lim's-Master-Class(KOR)

Next Post

Gradient Descent on 1D loss function

Written by

break, compose, display