STAT 436 (Spring 2024)

April 21, 2024

Kris Sankaran

Hierarchical Clustering

Clustering data at multiple scales using trees.

March 31, 2024

Kris Sankaran

Introduction to Dimensionality Reduction

Examples of high-dimensional data.

March 31, 2024

Kris Sankaran

Principal Components Analysis I

Linear dimensionality reduction using PCA.

March 31, 2024

Kris Sankaran

Principal Components Analysis II

Visualizing and interpreting PCA.

March 31, 2024

Kris Sankaran

Uniform Manifold Approximation and Projection

An overview of the UMAP algorithm.

March 31, 2024

Kris Sankaran

PCA and UMAP Examples

More examples of dimensionality reduction using PCA and UMAP.

March 13, 2024

Kris Sankaran

Introduction to Networks and Trees

Typical tasks and example network datasets.

Feb. 25, 2024

Kris Sankaran

Collections of Time Series

Navigating across related time series.

Feb. 18, 2024

Graphical Queries - Click Events

An introduction to click events in Shiny

Feb. 18, 2024

Graphical Queries - Brush Events

An introduction to brush events in Shiny.

Feb. 18, 2024

Linked Brushing

More examples defining brush queries using Shiny and `ggplot2`.

Feb. 18, 2024

Kris Sankaran

Linking using Crosstalk

Linking in web-based visualizations.

Feb. 17, 2024

Kris Sankaran

Elements of a Shiny App

Vocabulary used by the R Shiny Library, and a few example apps.

Feb. 17, 2024

Introduction to Reactivity

Viewing shiny code execution as a graph.

Feb. 17, 2024

IMDB Shiny Application

Using Shiny to explore a movies dataset

Jan. 10, 2024

Kris Sankaran

Spatial Data Formats

An overview of common formats, with illustrative examples.

Jan. 7, 2024

Kris Sankaran

Introduction to ggplot2

A discussion of ggplot2 terminology, and an example of iteratively refining a simple scatterplot.

Jan. 7, 2024

Kris Sankaran

A Vocabulary of Marks

Examples of encodings and sequential refinement of a plot.

Jan. 7, 2024

Kris Sankaran

Tidy Data

The definition of tidy data, and why it's often helpful for visualization._

Jan. 7, 2024

Kris Sankaran

Pivoting

Tools for reshaping data into tidy format.

Jan. 7, 2024

Kris Sankaran

Deriving Variables

Using `separate`, `mutate`, and `summarise` to derive new variables for downstream visualization.

Jan. 7, 2024

Kris Sankaran

Tidy Data Example

An extended example of tidying a real-world dataset.

Jan. 7, 2024

Kris Sankaran

Ridge Plots

An extended example of faceting with data summaries.

Jan. 7, 2024

Kris Sankaran

Compound Figures

Showing different variables across subpanels.

Jan. 7, 2024

Kris Sankaran

Patchwork

Implementing compound figures in R

Jan. 7, 2024

Kris Sankaran

tsibble Objects

A data structure for managing time series data.

Jan. 7, 2024

Kris Sankaran

Time Series Patterns

Vocabulary for describing visual structure in time series.

Jan. 7, 2024

Kris Sankaran

Seasonal Plots

Approaches for visualizing seasonality.

Jan. 7, 2024

Kris Sankaran

Cross and Auto-Correlation

Summaries of relationships between and within time series.

Jan. 7, 2024

Kris Sankaran

Vector Data

Manipulating and visualizing spatial vector data.

Jan. 7, 2024

Kris Sankaran

Raster Data

Storing spatially gridded information in rasters.

Jan. 7, 2024

Kris Sankaran

Coordinate Reference Systems

The projection problem, and how to check your CRS.

Jan. 7, 2024

Geospatial Interaction

Idioms for interacting with geographic data.

Jan. 7, 2024

Kris Sankaran

Node - Link Diagrams

The most common network visualization strategy.

Jan. 7, 2024

Kris Sankaran

Adjacency Matrix Views

A scalable network visualization strategy.

Jan. 7, 2024

Kris Sankaran

Enclosure

Visualization of hierarchical structure using containment.

Jan. 7, 2024

Kris Sankaran

K-means

An introduction to clustering and how to manage its output.

Jan. 7, 2024

Kris Sankaran

Heatmaps

Visualizing table values, ordered by clustering results.

Jan. 7, 2024

Kris Sankaran

Silhouette Statistics

Diagnostics for the quality of a clustering.

Jan. 7, 2024

Kris Sankaran

Cluster Stability

How reliable are the results of a clustering?

Jan. 7, 2024

Kris Sankaran

Introduction to Topic Models

An overview of dimensionality reduction via topics.

Jan. 7, 2024

Kris Sankaran

Fitting Topic Models

Data preparation and model fitting code for topics.

Jan. 7, 2024

Kris Sankaran

Visualizing Topic Models

Once we've fit a topic model, how should we inspect it?

Jan. 7, 2024

Kris Sankaran

Topic Modeling Case Study

An application to a gene expression dataset.

Jan. 7, 2024

Kris Sankaran

Partial Dependence Profiles I

An introduction to partial dependence profiles.

Jan. 7, 2024

Kris Sankaran

Partial Dependence Profiles II

Discovering richer structure in partial dependence profiles.

Jan. 7, 2024

Kris Sankaran

Visualization for Model Building

The relationship between exploratory analysis and model development.

Jan. 7, 2024

Kris Sankaran

Prior and Posterior Predictives

Simulating data to evaluate model quality.

Jan. 7, 2024

Kris Sankaran

Pointwise Diagnostics

Evaluating the fit at particular observations in Bayesian models.

Jan. 7, 2024

Kris Sankaran

Introduction to Feature Learning

An introduction to compositional feature learning.

Jan. 7, 2024

Kris Sankaran

Visualizing Learned Features

A first look at activations in a deep learning model.

Jan. 7, 2024

Kris Sankaran

Collections of Features

Analyzing feature activations across datasets

Jan. 7, 2024

Kris Sankaran

Optimizing Feature Maps

Interpreting neurons by finding optimal inputs

Jan. 7, 2024

Kris Sankaran

Final Takeaways

Some major themes from STAT 436, in a nutshell.

Jan. 7, 2024

Kris Sankaran

Design Process Case Study

Tracing the refinement of questions and design.

Jan. 7, 2024

Kris Sankaran

Asking Better Questions

What is the purpose of data analysis?

Jan. 7, 2024

Kris Sankaran

A History of Data Visualization up to 1900

A look at the origins of the field.

Jan. 10, 2023

Kris Sankaran

Faceting

Using small multiples to create information dense plots.

STAT 436 (Spring 2024)

Authors

Affiliations

Published

DOI

STAT 436 (Spring 2024)

Hierarchical Clustering

Introduction to Dimensionality Reduction

Principal Components Analysis I

Principal Components Analysis II

Uniform Manifold Approximation and Projection

PCA and UMAP Examples

Introduction to Networks and Trees

Collections of Time Series

Graphical Queries - Click Events

Graphical Queries - Brush Events

Linked Brushing

Linking using Crosstalk

Elements of a Shiny App

Introduction to Reactivity

IMDB Shiny Application

Spatial Data Formats

Introduction to ggplot2

A Vocabulary of Marks

Tidy Data

Pivoting

Deriving Variables

Tidy Data Example

Ridge Plots

Compound Figures

Patchwork

tsibble Objects

Time Series Patterns

Seasonal Plots

Cross and Auto-Correlation

Vector Data

Raster Data

Coordinate Reference Systems

Geospatial Interaction

Node - Link Diagrams

Adjacency Matrix Views

Enclosure

K-means

Heatmaps

Silhouette Statistics

Cluster Stability

Introduction to Topic Models

Fitting Topic Models

Visualizing Topic Models

Topic Modeling Case Study

Partial Dependence Profiles I

Partial Dependence Profiles II

Visualization for Model Building

Prior and Posterior Predictives

Pointwise Diagnostics

Introduction to Feature Learning

Visualizing Learned Features

Collections of Features

Optimizing Feature Maps

Final Takeaways

Design Process Case Study

Asking Better Questions

A History of Data Visualization up to 1900

Faceting

Footnotes