Research Notebooks

Key Ideas From
Important Papers

Sharing articles and tutorials on the finer details of training and tuning deep neural networks for maximum performance.

2024-04-10 optimization

Contrastive Language-Image Pretraining

Connecting text and images.

2024-04-06 optimization

Mode Connectivity

Local minima in loss landscapes are connected by high accuracy pathways.

2024-03-24 regularization optimization

AutoAugment

Learning optimal transformation pipelines for data augmentation.

2024-03-19 optimization

Gradient Boosting

Ensembles where new members are trained to correct previous mistakes.

2024-03-08 compression

Knowledge Distillation

Training a small model on the outputs of a larger and more accurate model.

2024-02-26 optimization

Double Descent

A phenomena where generalization gets worse then better with larger models and bigger datasets.

2024-02-15 optimization generation

Denoising Diffusion

A class of generative latent variable models inspired by nonequilibrium thermodynamics.

2024-01-29 compression

Optimal Brain Damage

An early method for pruning networks according to parameter saliency.

2024-01-22 optimization transfer

Low-Rank Adaptation

Reducing the storage requirements for fine tuned task specific networks.

2024-01-21 optimization ensemble

Snapshot Ensembles

A low-cost method that leverages checkpoints throughout the training trajectory.

2024-01-20 optimization reinforcement

Proximal Policy Optimization

A computationally efficient on-policy reinforcement learning algorithm.

2024-01-19 optimization neuroevolution

Natural Evolution Strategies

A family of algorithms for evolving the parameters of search distributions.

2024-01-18 regularization

Dropout

Masking random neurons on each forward pass during training.

2024-01-17 optimization reinforcement

World Models

Dreaming with generative models of reinforcement learning environments.

2024-01-16 optimization reinforcement

Deep Q-Learning

A foundational off-policy algorithm that kickstarted deep reinforcement learning.

2024-01-14 optimization

Stochastic Weight Averaging

An optimization trick for the final phases of training with SGD.

2024-01-13 compression

Lottery Ticket Hypothesis

Finding sparse subnetworks that train as well as dense networks from scratch.

2024-01-13 optimization reinforcement

Trust Region Policy Optimization

The monotonic on-policy reinforcement learning algorithm.

Sort

Top Recent Impactful Featured

All Time Past Year Past Month Past Week

Research Notebooks

Key Ideas From
Important Papers

Contrastive Language-Image Pretraining

Mode Connectivity

AutoAugment

Gradient Boosting

Knowledge Distillation

Double Descent

Denoising Diffusion

Optimal Brain Damage

Low-Rank Adaptation

Snapshot Ensembles

Proximal Policy Optimization

Natural Evolution Strategies

Dropout

World Models

Deep Q-Learning

Stochastic Weight Averaging

Lottery Ticket Hypothesis

Trust Region Policy Optimization

Search

Sort

Tags

Research Notebooks

Key Ideas From Important Papers

Contrastive Language-Image Pretraining

Mode Connectivity

AutoAugment

Gradient Boosting

Knowledge Distillation

Double Descent

Denoising Diffusion

Optimal Brain Damage

Low-Rank Adaptation

Snapshot Ensembles

Proximal Policy Optimization

Natural Evolution Strategies

Dropout

World Models

Deep Q-Learning

Stochastic Weight Averaging

Lottery Ticket Hypothesis

Trust Region Policy Optimization

Search

Sort

Tags

Key Ideas From
Important Papers