diff --git a/R/flash_models.R b/R/flash_models.R
index fe89f6b28..1f4cf0953 100644
--- a/R/flash_models.R
+++ b/R/flash_models.R
@@ -28,12 +28,12 @@
 #'
 #' @return A model_list object
 #' @details This function has two major differences from
-#'   \code{\link{tune_models}}: \enumerate{\item{It uses default hyperparameter
-#'   values to train models instead of using cross-validation to optimize
-#'   hyperparameter values for predictive performance.} \item{It is much
-#'   faster.}}
+#'   \code{\link{tune_models}}: 1. It uses fixed hyperparameter values to train
+#'   models instead of using cross-validation to optimize hyperparameter values
+#'   for predictive performance, and, as a result, 2. It is much faster.
 #'
 #' @examples
+#' \dontrun{
 #' # Prepare data
 #' prepped_data <- prep_data(pima_diabetes, patient_id, outcome = diabetes)
 #'
@@ -60,15 +60,14 @@
 #' summary(models)
 #'
 #' # Speed comparison of no tuning with flash_models vs. tuning with tune_models:
-#' \dontrun{
-#'   # ~40 seconds:
-#'   system.time(
-#'     tune_models(prepped_data, diabetes)
-#'   )
-#'   # ~6 seconds:
-#'   system.time(
-#'     flash_models(prepped_data, diabetes)
-#'   )
+#' # ~40 seconds:
+#' system.time(
+#'   tune_models(prepped_data, diabetes)
+#' )
+#' # ~6 seconds:
+#' system.time(
+#'   flash_models(prepped_data, diabetes)
+#' )
 #' }
 flash_models <- function(d,
                          outcome,
diff --git a/R/machine_learn.R b/R/machine_learn.R
index 6d44ad62f..498fc56a8 100644
--- a/R/machine_learn.R
+++ b/R/machine_learn.R
@@ -30,31 +30,37 @@
 #'   wraps. For finer control of model tuning use \code{\link{tune_models}}.
 #'
 #' @examples
-#' # Split data into training and test sets using a subset of the data for speed
-#' training_data <- pima_diabetes[1:50, ]
-#' test_data <- pima_diabetes[51:60, ]
+#' # Split the data into training and test sets, using just 100 rows for speed
+#' d <- split_train_test(d = pima_diabetes[1:100, ],
+#'                       outcome = diabetes,
+#'                       percent_train = .9)
 #'
 #' ### Classification ###
 #'
-#' # Clean and prep the data, tune algorithms over hyperparameter values to predict diabetes
-#' diabetes_models <- machine_learn(training_data, outcome = diabetes)
+#' # Clean and prep the training data, specifying that patient_id is an ID column,
+#' # and tune algorithms over hyperparameter values to predict diabetes
+#' diabetes_models <- machine_learn(d$train, patient_id, outcome = diabetes)
+#'
+#' # Inspect model specification and performance
+#' diabetes_models
 #'
 #' # Make predictions (predicted probability of diabetes) on test data
-#' predict(diabetes_models, test_data)
+#' predict(diabetes_models, d$test)
 #'
 #' ### Regression ###
 #'
-#' # Predict numeric outcomes simply by specifying the name of the outcome variable
-#' age_model <- machine_learn(training_data, outcome = age)
+#' # If the outcome variable is numeric, regression models will be trained
+#' age_model <- machine_learn(d$train, patient_id, outcome = age)
 #'
-#' # If new data isn't specifed, get predictions on training data. Plot predictions
+#' # If new data isn't specifed, get predictions on training data
 #' predict(age_model)
 #'
 #' ### Faster model training without tuning hyperparameters ###
 #'
-#' # Train models at set hyperparameter values by setting tune to FALSE.
-#' # This is faster (especially on larger datasets), but produces models with less predictive accuracy.
-#' machine_learn(training_data, outcome = diabetes, tune = FALSE)
+#' # Train models at set hyperparameter values by setting tune to FALSE. This is
+#' # faster (especially on larger datasets), but produces models with less
+#' # predictive accuracy.
+#' machine_learn(d$train, patient_id, outcome = diabetes, tune = FALSE)
 machine_learn <- function(d, ..., outcome, models,
                           tune = TRUE, n_folds = 5, tune_depth = 10,
                           impute = TRUE) {
diff --git a/R/model_list_generics.R b/R/model_list_generics.R
index dacfe5ca6..6088e871d 100644
--- a/R/model_list_generics.R
+++ b/R/model_list_generics.R
@@ -98,9 +98,8 @@ summary.model_list <- function(object, ...) {
 #' @importFrom purrr map_df
 #' @export
 #' @examples
-#' models <- tune_models(mtcars, mpg)
+#' models <- tune_models(mtcars, mpg, models = "knn", tune_depth = 5)
 #' plot(models)
-#' plot(as.model_list(models$`Random Forest`))
 plot.model_list <- function(x, print = TRUE, ...) {
   if (!length(x))
     stop("x is empty.")
diff --git a/R/plot_predictions.R b/R/plot_predictions.R
index 27a09d821..132aa5dbd 100644
--- a/R/plot_predictions.R
+++ b/R/plot_predictions.R
@@ -11,13 +11,14 @@
 #' @export
 #'
 #' @details The following arguments can be provided to customize the plot: For
-#'   regression: title, point_size, point_alpha, font_size. For
-#'   classification: title, fill_colors, fill_alpha, curve_flex, font_size. For
-#'   details on how to use them, see \code{\link{plot_regression_predictions}}
-#'   or \code{\link{plot_classification_predictions}}.
+#'   regression: title, point_size, point_alpha, font_size. For classification:
+#'   title, fill_colors, fill_alpha, curve_flex, font_size. For details on how
+#'   to use them, see \code{\link{plot_regression_predictions}} or
+#'   \code{\link{plot_classification_predictions}}.
 #'
 #' @examples
-#' models <- machine_learn(pima_diabetes[1:50, ], patient_id, outcome = plasma_glucose)
+#' models <- machine_learn(pima_diabetes[1:50, ], patient_id, outcome = plasma_glucose,
+#'                         models = "rf", tune = FALSE)
 #' predictions <- predict(models)
 #' plot(predictions)
 #' plot(predictions, title = "This model's predictions regress to the mean",
diff --git a/R/predict.R b/R/predict.R
index d01c1bac3..d6465e799 100644
--- a/R/predict.R
+++ b/R/predict.R
@@ -31,12 +31,15 @@
 #'   returning your predictions with the newdata in its original format.
 #'
 #' @examples
-#' # Tune models using only the first 50 rows to keep computation fast
-#' models <- machine_learn(pima_diabetes[1:50, ], outcome = diabetes)
-#' # Make prediction on the next 20 rows. This uses the best-performing model from
+#' # Tune models using only the first 20 rows to keep computation fast
+#'
+#' models <- machine_learn(pima_diabetes[1:20, ], patient_id, outcome = diabetes)
+#'
+#' # Make prediction on the next 5 rows. This uses the best-performing model from
 #' # tuning cross validation, and it also prepares the new data in the same way as
 #' # the training data was prepared.
-#' predictions <- predict(models, newdata = pima_diabetes[51:70, ])
+#'
+#' predictions <- predict(models, newdata = pima_diabetes[21:25, ])
 #' predictions
 #' plot(predictions)
 predict.model_list <- function(object, newdata, prepdata, ...) {
diff --git a/R/split_train_test.R b/R/split_train_test.R
index d671210cd..6a6c48864 100644
--- a/R/split_train_test.R
+++ b/R/split_train_test.R
@@ -3,7 +3,7 @@
 #' @param d Data frame
 #' @param outcome Target column, unquoted. Split will be stratified across this
 #'   variable
-#' @param p Proportion of rows in d to put into training. Default is 0.8
+#' @param percent_train Proportion of rows in d to put into training. Default is 0.8
 #' @param seed Optional, if provided the function will return the same split
 #'   each time it is called
 #'
@@ -14,7 +14,7 @@
 #'
 #' @examples
 #' split_train_test(mtcars, am, .9)
-split_train_test <- function(d, outcome, p = .8, seed) {
+split_train_test <- function(d, outcome, percent_train = .8, seed) {
   outcome <- rlang::enquo(outcome)
   if (rlang::quo_is_missing(outcome))
     stop("You must provide an outcome variable to tune_models.")
@@ -23,6 +23,7 @@ split_train_test <- function(d, outcome, p = .8, seed) {
     stop(outcome_chr, " isn't a column in d.")
   if (!missing(seed))
     set.seed(seed)
-  train_rows <- caret::createDataPartition(dplyr::pull(d, !!outcome), p = p)[[1]]
+  train_rows <- caret::createDataPartition(dplyr::pull(d, !!outcome),
+                                           p = percent_train)[[1]]
   list(train = d[train_rows, ], test = d[-train_rows, ])
 }
diff --git a/readme.Rmd b/README.Rmd
similarity index 95%
rename from readme.Rmd
rename to README.Rmd
index 183e67b9e..a35460e6a 100644
--- a/readme.Rmd
+++ b/README.Rmd
@@ -2,11 +2,12 @@
 output: github_document
 ---
 
-<!-- README.md is generated from README.Rmd. Please edit that file -->
+<!-- README.md is generated from README.Rmd. Please edit the .Rmd and knit it to generate the .md. -->
 
 ```{r, include = FALSE}
 knitr::opts_chunk$set(collapse = TRUE, comment = "# >",
-                      fig.height = 4, fig.width = 6)
+                      fig.height = 4, fig.width = 6,
+                      fig.path = "man/figures/README-")
 options(tibble.print_max = 5)
 library(healthcareai)
 ```
@@ -45,7 +46,7 @@ models
 
 Make predictions and examine predictive performance:
 
-```{r, fig.height = 3}
+```{r plot_predictions, fig.height = 3}
 predictions <- predict(models)
 plot(predictions)
 ```
diff --git a/README.md b/README.md
index 286da0392..4836d54cf 100644
--- a/README.md
+++ b/README.md
@@ -1,5 +1,5 @@
 
-<!-- README.md is generated from README.Rmd. Please edit that file -->
+<!-- README.md is generated from README.Rmd. Please edit the .Rmd and knit it to generate the .md. -->
 
 # healthcareai <img src="man/figures/logo.png" align="right" />
 
@@ -58,15 +58,15 @@ models
 # > Performance Metric: ROC
 # > Number of Observations: 768
 # > Number of Features: 12
-# > Models Trained: 2018-04-02 11:02:25 
+# > Models Trained: 2018-04-02 16:57:26 
 # > 
 # > Models tuned via 5-fold cross validation over 10 combinations of hyperparameter values.
 # > Best model: Random Forest
 # > ROC = 0.85
 # > Optimal hyperparameter values:
-# >   mtry = 3
+# >   mtry = 5
 # >   splitrule = extratrees
-# >   min.node.size = 19
+# >   min.node.size = 11
 ```
 
 Make predictions and examine predictive performance:
@@ -76,7 +76,7 @@ predictions <- predict(models)
 plot(predictions)
 ```
 
-![](readme_files/figure-gfm/unnamed-chunk-3-1.png)<!-- -->
+![](man/figures/README-plot_predictions-1.png)<!-- -->
 
 ## Learn More
 
diff --git a/docs/dev/CHANGELOG.html b/docs/dev/CHANGELOG.html
deleted file mode 100644
index 036d78230..000000000
--- a/docs/dev/CHANGELOG.html
+++ /dev/null
@@ -1,298 +0,0 @@
-<!-- Generated by pkgdown: do not edit by hand -->
-<!DOCTYPE html>
-<html>
-  <head>
-  <meta charset="utf-8">
-<meta http-equiv="X-UA-Compatible" content="IE=edge">
-<meta name="viewport" content="width=device-width, initial-scale=1.0">
-
-<title>Change Log • healthcareai</title>
-
-<!-- jquery -->
-<script src="https://code.jquery.com/jquery-3.1.0.min.js" integrity="sha384-nrOSfDHtoPMzJHjVTdCopGqIqeYETSXhZDFyniQ8ZHcVy08QesyHcnOUpMpqnmWq" crossorigin="anonymous"></script>
-<!-- Bootstrap -->
-<link href="https://maxcdn.bootstrapcdn.com/bootswatch/3.3.7/cerulean/bootstrap.min.css" rel="stylesheet" crossorigin="anonymous">
-
-<script src="https://maxcdn.bootstrapcdn.com/bootstrap/3.3.7/js/bootstrap.min.js" integrity="sha384-Tc5IQib027qvyjSMfHjOMaLkfuWVxZxUPnCJA7l2mCWNIpG9mGCD8wGNIcPD7Txa" crossorigin="anonymous"></script>
-
-<!-- Font Awesome icons -->
-<link href="https://maxcdn.bootstrapcdn.com/font-awesome/4.6.3/css/font-awesome.min.css" rel="stylesheet" integrity="sha384-T8Gy5hrqNKT+hzMclPo118YTQO6cYprQmhrYwIiQ/3axmI1hQomh7Ud2hPOy8SP1" crossorigin="anonymous">
-
-<!-- clipboard.js -->
-<script src="https://cdnjs.cloudflare.com/ajax/libs/clipboard.js/1.7.1/clipboard.min.js" integrity="sha384-cV+rhyOuRHc9Ub/91rihWcGmMmCXDeksTtCihMupQHSsi8GIIRDG0ThDc3HGQFJ3" crossorigin="anonymous"></script>
-
-<!-- pkgdown -->
-<link href="pkgdown.css" rel="stylesheet">
-<script src="jquery.sticky-kit.min.js"></script>
-<script src="pkgdown.js"></script>
-<meta property="og:title" content="Change Log" />
-
-<meta property="og:image" content="https://docs.healthcare.ai/logo.png" />
-<meta name="twitter:card" content="summary" />
-
-<meta name="robots" content="noindex">
-
-
-<!-- mathjax -->
-<script src='https://mathjax.rstudio.com/latest/MathJax.js?config=TeX-AMS-MML_HTMLorMML'></script>
-
-<!--[if lt IE 9]>
-<script src="https://oss.maxcdn.com/html5shiv/3.7.3/html5shiv.min.js"></script>
-<script src="https://oss.maxcdn.com/respond/1.4.2/respond.min.js"></script>
-<![endif]-->
-
-
-
-
-  </head>
-
-  <body>
-    <div class="container template-title-body">
-      <header>
-      <div class="navbar navbar-default navbar-fixed-top" role="navigation">
-  <div class="container">
-    <div class="navbar-header">
-      <button type="button" class="navbar-toggle collapsed" data-toggle="collapse" data-target="#navbar">
-        <span class="icon-bar"></span>
-        <span class="icon-bar"></span>
-        <span class="icon-bar"></span>
-      </button>
-      <span class="navbar-brand">
-        <a class="navbar-link" href="index.html">healthcareai</a>
-        <span class="label label-danger" data-toggle="tooltip" data-placement="bottom" title="In-development package">2.0.0</span>
-      </span>
-    </div>
-
-    <div id="navbar" class="navbar-collapse collapse">
-      <ul class="nav navbar-nav">
-        <li>
-  <a href="index.html">
-    <span class="fa fa-home fa-lg"></span>
-     
-  </a>
-</li>
-<li>
-  <a href="articles/healthcareai.html">Get started</a>
-</li>
-<li>
-  <a href="reference/index.html">Reference</a>
-</li>
-<li class="dropdown">
-  <a href="#" class="dropdown-toggle" data-toggle="dropdown" role="button" aria-expanded="false">
-    Articles
-     
-    <span class="caret"></span>
-  </a>
-  <ul class="dropdown-menu" role="menu">
-    <li>
-      <a href="articles/site_only/db_connections.html">Database Connections</a>
-    </li>
-  </ul>
-</li>
-      </ul>
-      
-      <ul class="nav navbar-nav navbar-right">
-        <li>
-  <a href="https://github.com/HealthCatalyst/healthcareai-r">
-    <span class="fa fa-github"></span>
-     
-  </a>
-</li>
-<li>
-  <a href="https://healthcare-ai.slack.com/">
-    <span class="fa fa-users"></span>
-     
-  </a>
-</li>
-      </ul>
-      
-    </div><!--/.nav-collapse -->
-  </div><!--/.container -->
-</div><!--/.navbar -->
-
-      
-      </header>
-
-<div class="row">
-  <div class="contents col-md-9">
-    <div class="page-header">
-      <h1>Change Log</h1>
-    </div>
-
-<div id="change-log" class="section level1">
-
-<p>All notable changes to this project will be documented in this file.</p>
-<p>The format is based on <a href="http://keepachangelog.com/">Keep a Changelog</a> and this project adheres to <a href="http://semver.org/">Semantic Versioning</a>.</p>
-<div id="section" class="section level2">
-<h2 class="hasAnchor">
-<a href="#section" class="anchor"></a>[2.0.0] - 2018-02-01</h2>
-<p>Major, breaking changes. R6 is out; S3 is in.</p>
-</div>
-<div id="section-1" class="section level2">
-<h2 class="hasAnchor">
-<a href="#section-1" class="anchor"></a>[1.2.0] - 2017-10-19</h2>
-<div id="added" class="section level3">
-<h3 class="hasAnchor">
-<a href="#added" class="anchor"></a>Added</h3>
-<ul>
-<li>
-<em>Limone</em> – a <a href="https://www.oreilly.com/learning/introduction-to-local-interpretable-model-agnostic-explanations-lime">lime</a>-like model interpretation tool.
-<ul>
-<li>Called via <code>getProcessVariablesDf</code>
-</li>
-<li>See examples at the end of the help files for <code>RandomForestDeployment</code> and <code>LassoDeployment</code> for usage details</li>
-</ul>
-</li>
-</ul>
-</div>
-</div>
-<div id="section-2" class="section level2">
-<h2 class="hasAnchor">
-<a href="#section-2" class="anchor"></a>[1.1.0] - 2017-10-11</h2>
-<div id="added-1" class="section level3">
-<h3 class="hasAnchor">
-<a href="#added-1" class="anchor"></a>Added</h3>
-<ul>
-<li>Deploy now saves information about the model and deployment as an attribute of the output dataframe. This information is written to a log file in the working directory.</li>
-<li>
-<code>skip_on_not_appveyor</code> will skip a unit test unless it’s being run on Appveyor.</li>
-</ul>
-</div>
-<div id="changed" class="section level3">
-<h3 class="hasAnchor">
-<a href="#changed" class="anchor"></a>Changed</h3>
-<ul>
-<li>Unit tests involving MSSQL now only run on Appveyor.</li>
-</ul>
-</div>
-<div id="removed" class="section level3">
-<h3 class="hasAnchor">
-<a href="#removed" class="anchor"></a>Removed</h3>
-<ul>
-<li>
-<code>skip_if_no_mssql</code> isn’t needed as a test utility anymore.</li>
-</ul>
-</div>
-</div>
-<div id="section-3" class="section level2">
-<h2 class="hasAnchor">
-<a href="#section-3" class="anchor"></a>[1.0.0] - 2017-08-02</h2>
-<div id="added-2" class="section level3">
-<h3 class="hasAnchor">
-<a href="#added-2" class="anchor"></a>Added</h3>
-<ul>
-<li>Multiclass functionality with XGBoost is supported using <code>XGBoostDevelopment</code> and <code>XGBoostDeployment</code>.</li>
-<li>K-means clustering is supported using <code>KmeansClustering</code>.</li>
-<li>
-<code>findVariaion</code> will return groups with the highest variation of a chosen target measure within a data set.</li>
-<li>
-<code>variationAcrossGroups</code> will plot a boxplot of variation between groups for a chosen target measure.</li>
-</ul>
-</div>
-<div id="changed-1" class="section level3">
-<h3 class="hasAnchor">
-<a href="#changed-1" class="anchor"></a>Changed</h3>
-<ul>
-<li>
-<code>SupervisedModelDevelopment</code> now saves the model after training</li>
-<li>
-<code>SupervisedModelDeployment</code> no longer trains models. It only loads the model saved in <code>SupervisedModelDevelopment</code>. Predictions are made for all data.</li>
-<li>
-<code>imputeColumn</code> was replaced with <code>imputeDF</code>
-</li>
-<li>SQL tools now use a <code>DBI</code> backend. We support reading and writing to MSSQL and SQLite databases.</li>
-<li>SQL tools are now common functions used outside the algorithms.</li>
-<li>Model file documentation files now accurately reflect the available methods.</li>
-</ul>
-</div>
-<div id="removed-1" class="section level3">
-<h3 class="hasAnchor">
-<a href="#removed-1" class="anchor"></a>Removed</h3>
-<ul>
-<li>
-<code>testWindowCol</code> is no longer a param in <code>SupervisedModelDeployment</code> or used in the algorithms.</li>
-<li>
-<code>writeToDB</code> is no longer a param in <code>SupervisedModelDeployment</code> or used in the algorithms.</li>
-<li>
-<code>destSchemaTable</code> is no longer a param in <code>SupervisedModelDeployment</code> or used in the algorithms.</li>
-</ul>
-</div>
-</div>
-<div id="section-4" class="section level2">
-<h2 class="hasAnchor">
-<a href="#section-4" class="anchor"></a>[0.1.12] - 2017-05-08</h2>
-<div id="added-3" class="section level3">
-<h3 class="hasAnchor">
-<a href="#added-3" class="anchor"></a>Added</h3>
-<ul>
-<li>Added getters for predictions <code>getPredictions()</code> in development (lasso, random forest, linear mixed model)</li>
-<li>Added getOutDf to each algorithm deploy file so predictions can go to CSV</li>
-<li>Added percentDataAvailableInDateRange, to eventually replace countPercentEmpty</li>
-<li>Added featureAvailabilityProfiler</li>
-</ul>
-</div>
-<div id="changed-2" class="section level3">
-<h3 class="hasAnchor">
-<a href="#changed-2" class="anchor"></a>Changed</h3>
-<ul>
-<li>TimeStamp column predictive output is now local time (not GMT)</li>
-</ul>
-</div>
-<div id="fixed" class="section level3">
-<h3 class="hasAnchor">
-<a href="#fixed" class="anchor"></a>Fixed</h3>
-</div>
-</div>
-<div id="section-5" class="section level2">
-<h2 class="hasAnchor">
-<a href="#section-5" class="anchor"></a><a href="https://github.com/HealthCatalystSLC/healthcareai-r/releases/tag/v0.1.11-beta">0.1.11</a> - 2017-03-02</h2>
-<div id="added-4" class="section level3">
-<h3 class="hasAnchor">
-<a href="#added-4" class="anchor"></a>Added</h3>
-<ul>
-<li>Added changelog</li>
-<li>Added travis.yml to prepare for CRAN release</li>
-</ul>
-</div>
-<div id="changed-3" class="section level3">
-<h3 class="hasAnchor">
-<a href="#changed-3" class="anchor"></a>Changed</h3>
-<ul>
-<li>generateAUC now calls getCutOffs to give guidance on ideal cutoffs.</li>
-<li>getCutOffs now generates list of cutoffs and suggests ideal ones.</li>
-<li>API changes for both functions.</li>
-<li>calculatePerformance (model class method) now calls generateAUC</li>
-</ul>
-</div>
-<div id="fixed-1" class="section level3">
-<h3 class="hasAnchor">
-<a href="#fixed-1" class="anchor"></a>Fixed</h3>
-<ul>
-<li>Bug fixes in example files concerning reproducability</li>
-</ul>
-</div>
-</div>
-</div>
-
-  </div>
-
-</div>
-
-
-      <footer>
-      <div class="copyright">
-  <p>Developed by Levi Thatcher, Michael Levy, Mike Mastanduno, Taylor Larsen, Taylor Miller.</p>
-</div>
-
-<div class="pkgdown">
-  <p>Site built with <a href="http://pkgdown.r-lib.org/">pkgdown</a>.</p>
-</div>
-
-      </footer>
-   </div>
-
-  
-
-  </body>
-</html>
-
diff --git a/docs/dev/articles/healthcareai.html b/docs/dev/articles/healthcareai.html
index c9c9e7128..1fcf04f99 100644
--- a/docs/dev/articles/healthcareai.html
+++ b/docs/dev/articles/healthcareai.html
@@ -103,63 +103,63 @@ <h1>Getting Started with healthcareai</h1>
 <div class="sourceCode" id="cb1"><pre class="sourceCode r"><code class="sourceCode r"><a class="sourceLine" id="cb1-1" data-line-number="1"><span class="kw">library</span>(healthcareai)</a></code></pre></div>
 <p><code>healthcareai</code> comes with a built in dataset documenting diabetes among adult Pima females. Once you attach the package, the dataset is available in the variable <code>pima_diabetes</code>. Let’s take a look at the data with the <code>str</code> function. There are 768 records in 10 variables including one identifier column, several nominal variables, and substantial missingness (represented in R by <code>NA</code>).</p>
 <div class="sourceCode" id="cb2"><pre class="sourceCode r"><code class="sourceCode r"><a class="sourceLine" id="cb2-1" data-line-number="1"><span class="kw">str</span>(pima_diabetes)</a>
-<a class="sourceLine" id="cb2-2" data-line-number="2"><span class="co">#&gt;  Classes 'tbl_df', 'tbl' and 'data.frame':   768 obs. of  10 variables:</span></a>
-<a class="sourceLine" id="cb2-3" data-line-number="3"><span class="co">#&gt;   $ patient_id    : int  1 2 3 4 5 6 7 8 9 10 ...</span></a>
-<a class="sourceLine" id="cb2-4" data-line-number="4"><span class="co">#&gt;   $ pregnancies   : int  6 1 8 1 0 5 3 10 2 8 ...</span></a>
-<a class="sourceLine" id="cb2-5" data-line-number="5"><span class="co">#&gt;   $ plasma_glucose: int  148 85 183 89 137 116 78 115 197 125 ...</span></a>
-<a class="sourceLine" id="cb2-6" data-line-number="6"><span class="co">#&gt;   $ diastolic_bp  : int  72 66 64 66 40 74 50 NA 70 96 ...</span></a>
-<a class="sourceLine" id="cb2-7" data-line-number="7"><span class="co">#&gt;   $ skinfold      : int  35 29 NA 23 35 NA 32 NA 45 NA ...</span></a>
-<a class="sourceLine" id="cb2-8" data-line-number="8"><span class="co">#&gt;   $ insulin       : int  NA NA NA 94 168 NA 88 NA 543 NA ...</span></a>
-<a class="sourceLine" id="cb2-9" data-line-number="9"><span class="co">#&gt;   $ weight_class  : chr  "obese" "overweight" "normal" "overweight" ...</span></a>
-<a class="sourceLine" id="cb2-10" data-line-number="10"><span class="co">#&gt;   $ pedigree      : num  0.627 0.351 0.672 0.167 2.288 ...</span></a>
-<a class="sourceLine" id="cb2-11" data-line-number="11"><span class="co">#&gt;   $ age           : int  50 31 32 21 33 30 26 29 53 54 ...</span></a>
-<a class="sourceLine" id="cb2-12" data-line-number="12"><span class="co">#&gt;   $ diabetes      : chr  "Y" "N" "Y" "N" ...</span></a></code></pre></div>
+<a class="sourceLine" id="cb2-2" data-line-number="2"><span class="co"># &gt; Classes 'tbl_df', 'tbl' and 'data.frame':   768 obs. of  10 variables:</span></a>
+<a class="sourceLine" id="cb2-3" data-line-number="3"><span class="co"># &gt;  $ patient_id    : int  1 2 3 4 5 6 7 8 9 10 ...</span></a>
+<a class="sourceLine" id="cb2-4" data-line-number="4"><span class="co"># &gt;  $ pregnancies   : int  6 1 8 1 0 5 3 10 2 8 ...</span></a>
+<a class="sourceLine" id="cb2-5" data-line-number="5"><span class="co"># &gt;  $ plasma_glucose: int  148 85 183 89 137 116 78 115 197 125 ...</span></a>
+<a class="sourceLine" id="cb2-6" data-line-number="6"><span class="co"># &gt;  $ diastolic_bp  : int  72 66 64 66 40 74 50 NA 70 96 ...</span></a>
+<a class="sourceLine" id="cb2-7" data-line-number="7"><span class="co"># &gt;  $ skinfold      : int  35 29 NA 23 35 NA 32 NA 45 NA ...</span></a>
+<a class="sourceLine" id="cb2-8" data-line-number="8"><span class="co"># &gt;  $ insulin       : int  NA NA NA 94 168 NA 88 NA 543 NA ...</span></a>
+<a class="sourceLine" id="cb2-9" data-line-number="9"><span class="co"># &gt;  $ weight_class  : chr  "obese" "overweight" "normal" "overweight" ...</span></a>
+<a class="sourceLine" id="cb2-10" data-line-number="10"><span class="co"># &gt;  $ pedigree      : num  0.627 0.351 0.672 0.167 2.288 ...</span></a>
+<a class="sourceLine" id="cb2-11" data-line-number="11"><span class="co"># &gt;  $ age           : int  50 31 32 21 33 30 26 29 53 54 ...</span></a>
+<a class="sourceLine" id="cb2-12" data-line-number="12"><span class="co"># &gt;  $ diabetes      : chr  "Y" "N" "Y" "N" ...</span></a></code></pre></div>
 <div id="easy-machine-learning" class="section level1">
 <h1 class="hasAnchor">
 <a href="#easy-machine-learning" class="anchor"></a>Easy Machine Learning</h1>
 <p>If you don’t want to fuss with details any more than necessary, <code>machine_learn</code> is the function for you. It makes it as easy as possible to implement machine learning models by putting all the detais in the background so that you don’t have to worry about them. Of course it might be wise to worry about them, and we’ll get to how to do that further down, but for now, you can automatically take care of problems in the data, do basic feature engineering, and tune multiple machine learning models using cross validation with <code>machine_learn</code>.</p>
 <p><code>machine_learn</code> always gets the name of the data frame, then any columns that should not be used by the model (uninformative columns, such as IDs), then the variable to be predicted with <code>outcome =</code>. If you want <code>machine_learn</code> to run faster, you can have that—at the expense of a bit of predictive power—by setting its <code>tune</code> argument to <code>FALSE</code>.</p>
 <div class="sourceCode" id="cb3"><pre class="sourceCode r"><code class="sourceCode r"><a class="sourceLine" id="cb3-1" data-line-number="1">quick_models &lt;-<span class="st"> </span><span class="kw"><a href="../reference/machine_learn.html">machine_learn</a></span>(pima_diabetes, patient_id, <span class="dt">outcome =</span> diabetes)</a>
-<a class="sourceLine" id="cb3-2" data-line-number="2"><span class="co">#&gt;  Training new data prep recipe</span></a>
-<a class="sourceLine" id="cb3-3" data-line-number="3"><span class="co">#&gt;  Variable(s) ignored in prep_data won't be used to tune models: patient_id</span></a>
-<a class="sourceLine" id="cb3-4" data-line-number="4"><span class="co">#&gt;  diabetes looks categorical, so training classification algorithms.</span></a>
-<a class="sourceLine" id="cb3-5" data-line-number="5"><span class="co">#&gt;  Running cross validation for Random Forest</span></a>
-<a class="sourceLine" id="cb3-6" data-line-number="6"><span class="co">#&gt;  Running cross validation for k-Nearest Neighbors</span></a></code></pre></div>
+<a class="sourceLine" id="cb3-2" data-line-number="2"><span class="co"># &gt; Training new data prep recipe</span></a>
+<a class="sourceLine" id="cb3-3" data-line-number="3"><span class="co"># &gt; Variable(s) ignored in prep_data won't be used to tune models: patient_id</span></a>
+<a class="sourceLine" id="cb3-4" data-line-number="4"><span class="co"># &gt; diabetes looks categorical, so training classification algorithms.</span></a>
+<a class="sourceLine" id="cb3-5" data-line-number="5"><span class="co"># &gt; Running cross validation for Random Forest</span></a>
+<a class="sourceLine" id="cb3-6" data-line-number="6"><span class="co"># &gt; Running cross validation for k-Nearest Neighbors</span></a></code></pre></div>
 <p><code>machine_learn</code> has told us that it has created a recipe for data preparation (this allows us to do exactly the same data cleaning and feature engineering when you want predictions on a new dataset), is ignoring <code>patient_id</code> when tuning models as we told it to, is training classification algorithms because the outcome variable <code>diabetes</code> is categorical, and has executed cross validation for two machine learning models: random forests, and k-nearest neighbors. Let’s see what the models look like.</p>
 <div class="sourceCode" id="cb4"><pre class="sourceCode r"><code class="sourceCode r"><a class="sourceLine" id="cb4-1" data-line-number="1">quick_models</a>
-<a class="sourceLine" id="cb4-2" data-line-number="2"><span class="co">#&gt;  Algorithms Trained: Random Forest, k-Nearest Neighbors</span></a>
-<a class="sourceLine" id="cb4-3" data-line-number="3"><span class="co">#&gt;  Target: diabetes</span></a>
-<a class="sourceLine" id="cb4-4" data-line-number="4"><span class="co">#&gt;  Class: Classification</span></a>
-<a class="sourceLine" id="cb4-5" data-line-number="5"><span class="co">#&gt;  Performance Metric: ROC</span></a>
-<a class="sourceLine" id="cb4-6" data-line-number="6"><span class="co">#&gt;  Number of Observations: 768</span></a>
-<a class="sourceLine" id="cb4-7" data-line-number="7"><span class="co">#&gt;  Number of Features: 12</span></a>
-<a class="sourceLine" id="cb4-8" data-line-number="8"><span class="co">#&gt;  Models Trained: 2018-04-02 11:00:11 </span></a>
-<a class="sourceLine" id="cb4-9" data-line-number="9"><span class="co">#&gt;  </span></a>
-<a class="sourceLine" id="cb4-10" data-line-number="10"><span class="co">#&gt;  Models tuned via 5-fold cross validation over 9 combinations of hyperparameter values.</span></a>
-<a class="sourceLine" id="cb4-11" data-line-number="11"><span class="co">#&gt;  Best model: Random Forest</span></a>
-<a class="sourceLine" id="cb4-12" data-line-number="12"><span class="co">#&gt;  ROC = 0.84</span></a>
-<a class="sourceLine" id="cb4-13" data-line-number="13"><span class="co">#&gt;  Optimal hyperparameter values:</span></a>
-<a class="sourceLine" id="cb4-14" data-line-number="14"><span class="co">#&gt;    mtry = 5</span></a>
-<a class="sourceLine" id="cb4-15" data-line-number="15"><span class="co">#&gt;    splitrule = extratrees</span></a>
-<a class="sourceLine" id="cb4-16" data-line-number="16"><span class="co">#&gt;    min.node.size = 12</span></a></code></pre></div>
+<a class="sourceLine" id="cb4-2" data-line-number="2"><span class="co"># &gt; Algorithms Trained: Random Forest, k-Nearest Neighbors</span></a>
+<a class="sourceLine" id="cb4-3" data-line-number="3"><span class="co"># &gt; Target: diabetes</span></a>
+<a class="sourceLine" id="cb4-4" data-line-number="4"><span class="co"># &gt; Class: Classification</span></a>
+<a class="sourceLine" id="cb4-5" data-line-number="5"><span class="co"># &gt; Performance Metric: ROC</span></a>
+<a class="sourceLine" id="cb4-6" data-line-number="6"><span class="co"># &gt; Number of Observations: 768</span></a>
+<a class="sourceLine" id="cb4-7" data-line-number="7"><span class="co"># &gt; Number of Features: 12</span></a>
+<a class="sourceLine" id="cb4-8" data-line-number="8"><span class="co"># &gt; Models Trained: 2018-04-02 18:37:21 </span></a>
+<a class="sourceLine" id="cb4-9" data-line-number="9"><span class="co"># &gt; </span></a>
+<a class="sourceLine" id="cb4-10" data-line-number="10"><span class="co"># &gt; Models tuned via 5-fold cross validation over 9 combinations of hyperparameter values.</span></a>
+<a class="sourceLine" id="cb4-11" data-line-number="11"><span class="co"># &gt; Best model: Random Forest</span></a>
+<a class="sourceLine" id="cb4-12" data-line-number="12"><span class="co"># &gt; ROC = 0.84</span></a>
+<a class="sourceLine" id="cb4-13" data-line-number="13"><span class="co"># &gt; Optimal hyperparameter values:</span></a>
+<a class="sourceLine" id="cb4-14" data-line-number="14"><span class="co"># &gt;   mtry = 5</span></a>
+<a class="sourceLine" id="cb4-15" data-line-number="15"><span class="co"># &gt;   splitrule = extratrees</span></a>
+<a class="sourceLine" id="cb4-16" data-line-number="16"><span class="co"># &gt;   min.node.size = 12</span></a></code></pre></div>
 <p>Everything looks as expected, and the best model is is a random forest that achives performance of AUROC = 0.84. Not bad for one line of code.</p>
 <p>Now that we have our models, we can make predictions using the <code>predict</code> function. If you provide a new data frame to <code>predict</code> it will make predictions on the new data; otherwise, it will make predictions on the training data.</p>
 <div class="sourceCode" id="cb5"><pre class="sourceCode r"><code class="sourceCode r"><a class="sourceLine" id="cb5-1" data-line-number="1">predictions &lt;-<span class="st"> </span><span class="kw">predict</span>(quick_models)</a>
 <a class="sourceLine" id="cb5-2" data-line-number="2">predictions</a>
-<a class="sourceLine" id="cb5-3" data-line-number="3"><span class="co">#&gt;  "predicted_diabetes" predicted by Random Forest last trained: 2018-04-02 11:00:11</span></a>
-<a class="sourceLine" id="cb5-4" data-line-number="4"><span class="co">#&gt;  Performance in training: ROC = 0.84</span></a>
-<a class="sourceLine" id="cb5-5" data-line-number="5"><span class="co">#&gt;  # A tibble: 768 x 14</span></a>
-<a class="sourceLine" id="cb5-6" data-line-number="6"><span class="co">#&gt;    diabetes predicted_diabetes pregnancies plasma_glucose diastolic_bp</span></a>
-<a class="sourceLine" id="cb5-7" data-line-number="7"><span class="co">#&gt;  * &lt;fct&gt;                 &lt;dbl&gt;       &lt;int&gt;          &lt;dbl&gt;        &lt;dbl&gt;</span></a>
-<a class="sourceLine" id="cb5-8" data-line-number="8"><span class="co">#&gt;  1 Y                   0.796             6           148.          72.</span></a>
-<a class="sourceLine" id="cb5-9" data-line-number="9"><span class="co">#&gt;  2 N                   0.0740            1            85.          66.</span></a>
-<a class="sourceLine" id="cb5-10" data-line-number="10"><span class="co">#&gt;  3 Y                   0.608             8           183.          64.</span></a>
-<a class="sourceLine" id="cb5-11" data-line-number="11"><span class="co">#&gt;  4 N                   0.00639           1            89.          66.</span></a>
-<a class="sourceLine" id="cb5-12" data-line-number="12"><span class="co">#&gt;  5 Y                   0.717             0           137.          40.</span></a>
-<a class="sourceLine" id="cb5-13" data-line-number="13"><span class="co">#&gt;  # ... with 763 more rows, and 9 more variables: skinfold &lt;dbl&gt;,</span></a>
-<a class="sourceLine" id="cb5-14" data-line-number="14"><span class="co">#&gt;  #   insulin &lt;dbl&gt;, pedigree &lt;dbl&gt;, age &lt;int&gt;, weight_class_normal &lt;dbl&gt;,</span></a>
-<a class="sourceLine" id="cb5-15" data-line-number="15"><span class="co">#&gt;  #   weight_class_obese &lt;dbl&gt;, weight_class_overweight &lt;dbl&gt;,</span></a>
-<a class="sourceLine" id="cb5-16" data-line-number="16"><span class="co">#&gt;  #   weight_class_other &lt;dbl&gt;, weight_class_hcai_missing &lt;dbl&gt;</span></a></code></pre></div>
+<a class="sourceLine" id="cb5-3" data-line-number="3"><span class="co"># &gt; "predicted_diabetes" predicted by Random Forest last trained: 2018-04-02 18:37:21</span></a>
+<a class="sourceLine" id="cb5-4" data-line-number="4"><span class="co"># &gt; Performance in training: ROC = 0.84</span></a>
+<a class="sourceLine" id="cb5-5" data-line-number="5"><span class="co"># &gt; # A tibble: 768 x 14</span></a>
+<a class="sourceLine" id="cb5-6" data-line-number="6"><span class="co"># &gt;   diabetes predicted_diabetes pregnancies plasma_glucose diastolic_bp</span></a>
+<a class="sourceLine" id="cb5-7" data-line-number="7"><span class="co"># &gt; * &lt;fct&gt;                 &lt;dbl&gt;       &lt;int&gt;          &lt;dbl&gt;        &lt;dbl&gt;</span></a>
+<a class="sourceLine" id="cb5-8" data-line-number="8"><span class="co"># &gt; 1 Y                   0.796             6           148.          72.</span></a>
+<a class="sourceLine" id="cb5-9" data-line-number="9"><span class="co"># &gt; 2 N                   0.0740            1            85.          66.</span></a>
+<a class="sourceLine" id="cb5-10" data-line-number="10"><span class="co"># &gt; 3 Y                   0.608             8           183.          64.</span></a>
+<a class="sourceLine" id="cb5-11" data-line-number="11"><span class="co"># &gt; 4 N                   0.00639           1            89.          66.</span></a>
+<a class="sourceLine" id="cb5-12" data-line-number="12"><span class="co"># &gt; 5 Y                   0.717             0           137.          40.</span></a>
+<a class="sourceLine" id="cb5-13" data-line-number="13"><span class="co"># &gt; # ... with 763 more rows, and 9 more variables: skinfold &lt;dbl&gt;,</span></a>
+<a class="sourceLine" id="cb5-14" data-line-number="14"><span class="co"># &gt; #   insulin &lt;dbl&gt;, pedigree &lt;dbl&gt;, age &lt;int&gt;, weight_class_normal &lt;dbl&gt;,</span></a>
+<a class="sourceLine" id="cb5-15" data-line-number="15"><span class="co"># &gt; #   weight_class_obese &lt;dbl&gt;, weight_class_overweight &lt;dbl&gt;,</span></a>
+<a class="sourceLine" id="cb5-16" data-line-number="16"><span class="co"># &gt; #   weight_class_other &lt;dbl&gt;, weight_class_hcai_missing &lt;dbl&gt;</span></a></code></pre></div>
 <p>We get a message about when the model was trained and how well it preformed in training, and we get back a data frame that looks sort of like the original, but has a new column <code>predited_diabetes</code> that contains the model-generated probability each individual has diabetes, and contains changes that were made preparing the data for model training, e.g. missingness has been filled in and <code>weight_class</code> has been split into a series of “dummy” variables.</p>
 <p>We can plot how effectively the model is able to separate diabetic from non-diabetic individuals by calling the <code>plot</code> function on the output of <code>predict</code>.</p>
 <div class="sourceCode" id="cb6"><pre class="sourceCode r"><code class="sourceCode r"><a class="sourceLine" id="cb6-1" data-line-number="1"><span class="kw">plot</span>(predictions)</a></code></pre></div>
@@ -170,17 +170,17 @@ <h1 class="hasAnchor">
 <a href="#data-profiling" class="anchor"></a>Data Profiling</h1>
 <p>It is always a good idea to be aware of where there are missing values in data. The <code>missingness</code> function helps with that. In addition to looking for values R sees as missing, it looks for other values that might represent missing, such as <code>"NULL"</code>, and issues a warning if it finds any.</p>
 <div class="sourceCode" id="cb7"><pre class="sourceCode r"><code class="sourceCode r"><a class="sourceLine" id="cb7-1" data-line-number="1"><span class="kw"><a href="../reference/missingness.html">missingness</a></span>(pima_diabetes)</a>
-<a class="sourceLine" id="cb7-2" data-line-number="2"><span class="co">#&gt;           variable percent_missing</span></a>
-<a class="sourceLine" id="cb7-3" data-line-number="3"><span class="co">#&gt;  1      patient_id             0.0</span></a>
-<a class="sourceLine" id="cb7-4" data-line-number="4"><span class="co">#&gt;  2     pregnancies             0.0</span></a>
-<a class="sourceLine" id="cb7-5" data-line-number="5"><span class="co">#&gt;  3        pedigree             0.0</span></a>
-<a class="sourceLine" id="cb7-6" data-line-number="6"><span class="co">#&gt;  4             age             0.0</span></a>
-<a class="sourceLine" id="cb7-7" data-line-number="7"><span class="co">#&gt;  5        diabetes             0.0</span></a>
-<a class="sourceLine" id="cb7-8" data-line-number="8"><span class="co">#&gt;  6  plasma_glucose             0.7</span></a>
-<a class="sourceLine" id="cb7-9" data-line-number="9"><span class="co">#&gt;  7    weight_class             1.4</span></a>
-<a class="sourceLine" id="cb7-10" data-line-number="10"><span class="co">#&gt;  8    diastolic_bp             4.6</span></a>
-<a class="sourceLine" id="cb7-11" data-line-number="11"><span class="co">#&gt;  9        skinfold            29.6</span></a>
-<a class="sourceLine" id="cb7-12" data-line-number="12"><span class="co">#&gt;  10        insulin            48.7</span></a></code></pre></div>
+<a class="sourceLine" id="cb7-2" data-line-number="2"><span class="co"># &gt;          variable percent_missing</span></a>
+<a class="sourceLine" id="cb7-3" data-line-number="3"><span class="co"># &gt; 1      patient_id             0.0</span></a>
+<a class="sourceLine" id="cb7-4" data-line-number="4"><span class="co"># &gt; 2     pregnancies             0.0</span></a>
+<a class="sourceLine" id="cb7-5" data-line-number="5"><span class="co"># &gt; 3        pedigree             0.0</span></a>
+<a class="sourceLine" id="cb7-6" data-line-number="6"><span class="co"># &gt; 4             age             0.0</span></a>
+<a class="sourceLine" id="cb7-7" data-line-number="7"><span class="co"># &gt; 5        diabetes             0.0</span></a>
+<a class="sourceLine" id="cb7-8" data-line-number="8"><span class="co"># &gt; 6  plasma_glucose             0.7</span></a>
+<a class="sourceLine" id="cb7-9" data-line-number="9"><span class="co"># &gt; 7    weight_class             1.4</span></a>
+<a class="sourceLine" id="cb7-10" data-line-number="10"><span class="co"># &gt; 8    diastolic_bp             4.6</span></a>
+<a class="sourceLine" id="cb7-11" data-line-number="11"><span class="co"># &gt; 9        skinfold            29.6</span></a>
+<a class="sourceLine" id="cb7-12" data-line-number="12"><span class="co"># &gt; 10        insulin            48.7</span></a></code></pre></div>
 <p>It’s good that we don’t have any missingness in our ID or outcome columns. We’ll see how missingness in predictors is addressed further down.</p>
 </div>
 <div id="data-preparation" class="section level1">
@@ -197,7 +197,7 @@ <h1 class="hasAnchor">
 <div class="sourceCode" id="cb9"><pre class="sourceCode r"><code class="sourceCode r"><a class="sourceLine" id="cb9-1" data-line-number="1">prepped_training_data &lt;-<span class="st"> </span><span class="kw"><a href="../reference/prep_data.html">prep_data</a></span>(split_data<span class="op">$</span>train, patient_id, <span class="dt">outcome =</span> diabetes,</a>
 <a class="sourceLine" id="cb9-2" data-line-number="2">                                   <span class="dt">center =</span> <span class="ot">TRUE</span>, <span class="dt">scale =</span> <span class="ot">TRUE</span>,</a>
 <a class="sourceLine" id="cb9-3" data-line-number="3">                                   <span class="dt">collapse_rare_factors =</span> <span class="ot">FALSE</span>)</a>
-<a class="sourceLine" id="cb9-4" data-line-number="4"><span class="co">#&gt;  Training new data prep recipe</span></a></code></pre></div>
+<a class="sourceLine" id="cb9-4" data-line-number="4"><span class="co"># &gt; Training new data prep recipe</span></a></code></pre></div>
 <p>The “recipe” that the above message refers to is a set of instructions for how to transform a dataset the way we just transformed our training data. Any machine learning that we do (within <code>healthcareai</code>) on <code>prepped_training_data</code> will retain that recipe and apply it before making predictions on new data. That means that when you have models making predictions in production, you don’t have to figure out how to transform the data or worry about encountering missing data or new category levels.</p>
 </div>
 <div id="model-training" class="section level1">
@@ -211,10 +211,10 @@ <h1 class="hasAnchor">
 <a class="sourceLine" id="cb10-3" data-line-number="3">                      <span class="dt">models =</span> <span class="st">"RF"</span>,</a>
 <a class="sourceLine" id="cb10-4" data-line-number="4">                      <span class="dt">tune_depth =</span> <span class="dv">25</span>,</a>
 <a class="sourceLine" id="cb10-5" data-line-number="5">                      <span class="dt">metric =</span> <span class="st">"PR"</span>)</a>
-<a class="sourceLine" id="cb10-6" data-line-number="6"><span class="co">#&gt;  Variable(s) ignored in prep_data won't be used to tune models: patient_id</span></a>
-<a class="sourceLine" id="cb10-7" data-line-number="7"><span class="co">#&gt;  diabetes looks categorical, so training classification algorithms.</span></a>
-<a class="sourceLine" id="cb10-8" data-line-number="8"><span class="co">#&gt;  You've chosen to tune 125 models (n_folds = 5 x tune_depth = 25 x length(models) = 1) on a 692 row dataset. This may take a while...</span></a>
-<a class="sourceLine" id="cb10-9" data-line-number="9"><span class="co">#&gt;  Running cross validation for Random Forest</span></a></code></pre></div>
+<a class="sourceLine" id="cb10-6" data-line-number="6"><span class="co"># &gt; Variable(s) ignored in prep_data won't be used to tune models: patient_id</span></a>
+<a class="sourceLine" id="cb10-7" data-line-number="7"><span class="co"># &gt; diabetes looks categorical, so training classification algorithms.</span></a>
+<a class="sourceLine" id="cb10-8" data-line-number="8"><span class="co"># &gt; You've chosen to tune 125 models (n_folds = 5 x tune_depth = 25 x length(models) = 1) on a 692 row dataset. This may take a while...</span></a>
+<a class="sourceLine" id="cb10-9" data-line-number="9"><span class="co"># &gt; Running cross validation for Random Forest</span></a></code></pre></div>
 <p>We get a message saying the training may take a while because we’re training so many models, but in this case it takes just about 20 seconds to train all those models.</p>
 <p>We can examine how the model performs across hyperparameters by plotting the model object. It looks like extratrees is a superior split rule for this model, and larger values of minimum node size tend to do better.</p>
 <div class="sourceCode" id="cb11"><pre class="sourceCode r"><code class="sourceCode r"><a class="sourceLine" id="cb11-1" data-line-number="1"><span class="kw">plot</span>(models)</a></code></pre></div>
@@ -228,23 +228,23 @@ <h2 class="hasAnchor">
 <a class="sourceLine" id="cb12-2" data-line-number="2">             <span class="dt">outcome =</span> diabetes,</a>
 <a class="sourceLine" id="cb12-3" data-line-number="3">             <span class="dt">models =</span> <span class="st">"RF"</span>,</a>
 <a class="sourceLine" id="cb12-4" data-line-number="4">             <span class="dt">metric =</span> <span class="st">"PR"</span>)</a>
-<a class="sourceLine" id="cb12-5" data-line-number="5"><span class="co">#&gt;  Variable(s) ignored in prep_data won't be used to tune models: patient_id</span></a>
-<a class="sourceLine" id="cb12-6" data-line-number="6"><span class="co">#&gt;  diabetes looks categorical, so training classification algorithms.</span></a>
-<a class="sourceLine" id="cb12-7" data-line-number="7"><span class="co">#&gt;  Algorithms Trained: Random Forest</span></a>
-<a class="sourceLine" id="cb12-8" data-line-number="8"><span class="co">#&gt;  Target: diabetes</span></a>
-<a class="sourceLine" id="cb12-9" data-line-number="9"><span class="co">#&gt;  Class: Classification</span></a>
-<a class="sourceLine" id="cb12-10" data-line-number="10"><span class="co">#&gt;  Performance Metric: PR</span></a>
-<a class="sourceLine" id="cb12-11" data-line-number="11"><span class="co">#&gt;  Number of Observations: 692</span></a>
-<a class="sourceLine" id="cb12-12" data-line-number="12"><span class="co">#&gt;  Number of Features: 13</span></a>
-<a class="sourceLine" id="cb12-13" data-line-number="13"><span class="co">#&gt;  Models Trained: 2018-04-02 11:00:37 </span></a>
-<a class="sourceLine" id="cb12-14" data-line-number="14"><span class="co">#&gt;  </span></a>
-<a class="sourceLine" id="cb12-15" data-line-number="15"><span class="co">#&gt;  Models have not been tuned. Performance estimated via 5-fold cross validation at fixed hyperparameter values.</span></a>
-<a class="sourceLine" id="cb12-16" data-line-number="16"><span class="co">#&gt;  Best model: Random Forest</span></a>
-<a class="sourceLine" id="cb12-17" data-line-number="17"><span class="co">#&gt;  PR = 0.89</span></a>
-<a class="sourceLine" id="cb12-18" data-line-number="18"><span class="co">#&gt;  User-selected hyperparameter values:</span></a>
-<a class="sourceLine" id="cb12-19" data-line-number="19"><span class="co">#&gt;    mtry = 5</span></a>
-<a class="sourceLine" id="cb12-20" data-line-number="20"><span class="co">#&gt;    splitrule = extratrees</span></a>
-<a class="sourceLine" id="cb12-21" data-line-number="21"><span class="co">#&gt;    min.node.size = 10</span></a></code></pre></div>
+<a class="sourceLine" id="cb12-5" data-line-number="5"><span class="co"># &gt; Variable(s) ignored in prep_data won't be used to tune models: patient_id</span></a>
+<a class="sourceLine" id="cb12-6" data-line-number="6"><span class="co"># &gt; diabetes looks categorical, so training classification algorithms.</span></a>
+<a class="sourceLine" id="cb12-7" data-line-number="7"><span class="co"># &gt; Algorithms Trained: Random Forest</span></a>
+<a class="sourceLine" id="cb12-8" data-line-number="8"><span class="co"># &gt; Target: diabetes</span></a>
+<a class="sourceLine" id="cb12-9" data-line-number="9"><span class="co"># &gt; Class: Classification</span></a>
+<a class="sourceLine" id="cb12-10" data-line-number="10"><span class="co"># &gt; Performance Metric: PR</span></a>
+<a class="sourceLine" id="cb12-11" data-line-number="11"><span class="co"># &gt; Number of Observations: 692</span></a>
+<a class="sourceLine" id="cb12-12" data-line-number="12"><span class="co"># &gt; Number of Features: 13</span></a>
+<a class="sourceLine" id="cb12-13" data-line-number="13"><span class="co"># &gt; Models Trained: 2018-04-02 18:37:46 </span></a>
+<a class="sourceLine" id="cb12-14" data-line-number="14"><span class="co"># &gt; </span></a>
+<a class="sourceLine" id="cb12-15" data-line-number="15"><span class="co"># &gt; Models have not been tuned. Performance estimated via 5-fold cross validation at fixed hyperparameter values.</span></a>
+<a class="sourceLine" id="cb12-16" data-line-number="16"><span class="co"># &gt; Best model: Random Forest</span></a>
+<a class="sourceLine" id="cb12-17" data-line-number="17"><span class="co"># &gt; PR = 0.89</span></a>
+<a class="sourceLine" id="cb12-18" data-line-number="18"><span class="co"># &gt; User-selected hyperparameter values:</span></a>
+<a class="sourceLine" id="cb12-19" data-line-number="19"><span class="co"># &gt;   mtry = 5</span></a>
+<a class="sourceLine" id="cb12-20" data-line-number="20"><span class="co"># &gt;   splitrule = extratrees</span></a>
+<a class="sourceLine" id="cb12-21" data-line-number="21"><span class="co"># &gt;   min.node.size = 10</span></a></code></pre></div>
 <p>In this case we sacrificed just 0.01 AUPR versus tuning the models. In our experience, that’s on the small side of typical. A good workflow is often to do all of your development using <code>flash_models</code>, and as a final step before putting a model into production, retrain the model using <code>tune_models</code>.</p>
 </div>
 </div>
@@ -253,24 +253,24 @@ <h1 class="hasAnchor">
 <a href="#prediction" class="anchor"></a>Prediction</h1>
 <p><code>predict</code> will automatically use the best-performing model from training (evaluated out-of-fold in cross validation). If no new data is passed to <code>predict</code> it will make predictions on the training dataset. The predicted probabilities appear in the <code>predicted_diabetes</code> column.</p>
 <div class="sourceCode" id="cb13"><pre class="sourceCode r"><code class="sourceCode r"><a class="sourceLine" id="cb13-1" data-line-number="1"><span class="kw">predict</span>(models)</a>
-<a class="sourceLine" id="cb13-2" data-line-number="2"><span class="co">#&gt;  "predicted_diabetes" predicted by Random Forest last trained: 2018-04-02 11:00:34</span></a>
-<a class="sourceLine" id="cb13-3" data-line-number="3"><span class="co">#&gt;  Performance in training: PR = 0.9</span></a>
-<a class="sourceLine" id="cb13-4" data-line-number="4"><span class="co">#&gt;  # A tibble: 692 x 15</span></a>
-<a class="sourceLine" id="cb13-5" data-line-number="5"><span class="co">#&gt;    diabetes predicted_diabetes pregnancies plasma_glucose diastolic_bp</span></a>
-<a class="sourceLine" id="cb13-6" data-line-number="6"><span class="co">#&gt;  * &lt;fct&gt;                 &lt;dbl&gt;       &lt;dbl&gt;          &lt;dbl&gt;        &lt;dbl&gt;</span></a>
-<a class="sourceLine" id="cb13-7" data-line-number="7"><span class="co">#&gt;  1 N                   0.0677       -0.843         -1.19        -0.521</span></a>
-<a class="sourceLine" id="cb13-8" data-line-number="8"><span class="co">#&gt;  2 Y                   0.642         1.22           2.01        -0.686</span></a>
-<a class="sourceLine" id="cb13-9" data-line-number="9"><span class="co">#&gt;  3 N                   0.00366      -0.843         -1.05        -0.521</span></a>
-<a class="sourceLine" id="cb13-10" data-line-number="10"><span class="co">#&gt;  4 Y                   0.723        -1.14           0.509       -2.66 </span></a>
-<a class="sourceLine" id="cb13-11" data-line-number="11"><span class="co">#&gt;  5 N                   0.228         0.338         -0.175        0.138</span></a>
-<a class="sourceLine" id="cb13-12" data-line-number="12"><span class="co">#&gt;  # ... with 687 more rows, and 10 more variables: skinfold &lt;dbl&gt;,</span></a>
-<a class="sourceLine" id="cb13-13" data-line-number="13"><span class="co">#&gt;  #   insulin &lt;dbl&gt;, pedigree &lt;dbl&gt;, age &lt;dbl&gt;, weight_class_normal &lt;dbl&gt;,</span></a>
-<a class="sourceLine" id="cb13-14" data-line-number="14"><span class="co">#&gt;  #   weight_class_obese &lt;dbl&gt;, weight_class_overweight &lt;dbl&gt;,</span></a>
-<a class="sourceLine" id="cb13-15" data-line-number="15"><span class="co">#&gt;  #   weight_class_underweight &lt;dbl&gt;, weight_class_hcai_missing &lt;dbl&gt;,</span></a>
-<a class="sourceLine" id="cb13-16" data-line-number="16"><span class="co">#&gt;  #   weight_class_other &lt;dbl&gt;</span></a></code></pre></div>
+<a class="sourceLine" id="cb13-2" data-line-number="2"><span class="co"># &gt; "predicted_diabetes" predicted by Random Forest last trained: 2018-04-02 18:37:43</span></a>
+<a class="sourceLine" id="cb13-3" data-line-number="3"><span class="co"># &gt; Performance in training: PR = 0.9</span></a>
+<a class="sourceLine" id="cb13-4" data-line-number="4"><span class="co"># &gt; # A tibble: 692 x 15</span></a>
+<a class="sourceLine" id="cb13-5" data-line-number="5"><span class="co"># &gt;   diabetes predicted_diabetes pregnancies plasma_glucose diastolic_bp</span></a>
+<a class="sourceLine" id="cb13-6" data-line-number="6"><span class="co"># &gt; * &lt;fct&gt;                 &lt;dbl&gt;       &lt;dbl&gt;          &lt;dbl&gt;        &lt;dbl&gt;</span></a>
+<a class="sourceLine" id="cb13-7" data-line-number="7"><span class="co"># &gt; 1 N                   0.0677       -0.843         -1.19        -0.521</span></a>
+<a class="sourceLine" id="cb13-8" data-line-number="8"><span class="co"># &gt; 2 Y                   0.642         1.22           2.01        -0.686</span></a>
+<a class="sourceLine" id="cb13-9" data-line-number="9"><span class="co"># &gt; 3 N                   0.00366      -0.843         -1.05        -0.521</span></a>
+<a class="sourceLine" id="cb13-10" data-line-number="10"><span class="co"># &gt; 4 Y                   0.723        -1.14           0.509       -2.66 </span></a>
+<a class="sourceLine" id="cb13-11" data-line-number="11"><span class="co"># &gt; 5 N                   0.228         0.338         -0.175        0.138</span></a>
+<a class="sourceLine" id="cb13-12" data-line-number="12"><span class="co"># &gt; # ... with 687 more rows, and 10 more variables: skinfold &lt;dbl&gt;,</span></a>
+<a class="sourceLine" id="cb13-13" data-line-number="13"><span class="co"># &gt; #   insulin &lt;dbl&gt;, pedigree &lt;dbl&gt;, age &lt;dbl&gt;, weight_class_normal &lt;dbl&gt;,</span></a>
+<a class="sourceLine" id="cb13-14" data-line-number="14"><span class="co"># &gt; #   weight_class_obese &lt;dbl&gt;, weight_class_overweight &lt;dbl&gt;,</span></a>
+<a class="sourceLine" id="cb13-15" data-line-number="15"><span class="co"># &gt; #   weight_class_underweight &lt;dbl&gt;, weight_class_hcai_missing &lt;dbl&gt;,</span></a>
+<a class="sourceLine" id="cb13-16" data-line-number="16"><span class="co"># &gt; #   weight_class_other &lt;dbl&gt;</span></a></code></pre></div>
 <p>To get predictions on a new dataset, pass the new data to <code>predict</code>, and it will automatically be prepared based on the recipe generated on the training data. We can plot the predictions to see how well our model is doing, and we see that it’s separating diabetic from non-diabetic individuals pretty well, although there a fair number of non-diabetics with high predicted probabilities of diabetes. This may be due to optimizing for precision recall, or may indicate pre-diabetic patients.</p>
 <div class="sourceCode" id="cb14"><pre class="sourceCode r"><code class="sourceCode r"><a class="sourceLine" id="cb14-1" data-line-number="1">test_predictions &lt;-<span class="st"> </span><span class="kw">predict</span>(models, split_data<span class="op">$</span>test)</a>
-<a class="sourceLine" id="cb14-2" data-line-number="2"><span class="co">#&gt;  Prepping data based on provided recipe</span></a>
+<a class="sourceLine" id="cb14-2" data-line-number="2"><span class="co"># &gt; Prepping data based on provided recipe</span></a>
 <a class="sourceLine" id="cb14-3" data-line-number="3"><span class="kw">plot</span>(test_predictions)</a></code></pre></div>
 <p><img src="healthcareai_files/figure-html/unnamed-chunk-14-1.png" width="576"></p>
 </div>
@@ -279,44 +279,44 @@ <h1 class="hasAnchor">
 <a href="#a-regression-example" class="anchor"></a>A Regression Example</h1>
 <p>All the examples above have been classification tasks, predicting a yes/no outcome. Here’s an example of a full regression modeling pipeline on a silly problem: predicting individuals’ ages. The code is very similar to classification.</p>
 <div class="sourceCode" id="cb15"><pre class="sourceCode r"><code class="sourceCode r"><a class="sourceLine" id="cb15-1" data-line-number="1">regression_models &lt;-<span class="st"> </span><span class="kw"><a href="../reference/machine_learn.html">machine_learn</a></span>(pima_diabetes, patient_id, <span class="dt">outcome =</span> age)</a>
-<a class="sourceLine" id="cb15-2" data-line-number="2"><span class="co">#&gt;  Training new data prep recipe</span></a>
-<a class="sourceLine" id="cb15-3" data-line-number="3"><span class="co">#&gt;  Variable(s) ignored in prep_data won't be used to tune models: patient_id</span></a>
-<a class="sourceLine" id="cb15-4" data-line-number="4"><span class="co">#&gt;  age looks numeric, so training regression algorithms.</span></a>
-<a class="sourceLine" id="cb15-5" data-line-number="5"><span class="co">#&gt;  Running cross validation for Random Forest</span></a>
-<a class="sourceLine" id="cb15-6" data-line-number="6"><span class="co">#&gt;  Running cross validation for k-Nearest Neighbors</span></a>
+<a class="sourceLine" id="cb15-2" data-line-number="2"><span class="co"># &gt; Training new data prep recipe</span></a>
+<a class="sourceLine" id="cb15-3" data-line-number="3"><span class="co"># &gt; Variable(s) ignored in prep_data won't be used to tune models: patient_id</span></a>
+<a class="sourceLine" id="cb15-4" data-line-number="4"><span class="co"># &gt; age looks numeric, so training regression algorithms.</span></a>
+<a class="sourceLine" id="cb15-5" data-line-number="5"><span class="co"># &gt; Running cross validation for Random Forest</span></a>
+<a class="sourceLine" id="cb15-6" data-line-number="6"><span class="co"># &gt; Running cross validation for k-Nearest Neighbors</span></a>
 <a class="sourceLine" id="cb15-7" data-line-number="7"><span class="kw">summary</span>(regression_models)</a>
-<a class="sourceLine" id="cb15-8" data-line-number="8"><span class="co">#&gt;  Models trained: 2018-04-02 11:00:50</span></a>
-<a class="sourceLine" id="cb15-9" data-line-number="9"><span class="co">#&gt;  </span></a>
-<a class="sourceLine" id="cb15-10" data-line-number="10"><span class="co">#&gt;  Models tuned via 5-fold cross validation over 10 combinations of hyperparameter values.</span></a>
-<a class="sourceLine" id="cb15-11" data-line-number="11"><span class="co">#&gt;  Best performance: RMSE = 9.07</span></a>
-<a class="sourceLine" id="cb15-12" data-line-number="12"><span class="co">#&gt;  By Random Forest with hyperparameters:</span></a>
-<a class="sourceLine" id="cb15-13" data-line-number="13"><span class="co">#&gt;    mtry = 10</span></a>
-<a class="sourceLine" id="cb15-14" data-line-number="14"><span class="co">#&gt;    splitrule = extratrees</span></a>
-<a class="sourceLine" id="cb15-15" data-line-number="15"><span class="co">#&gt;    min.node.size = 10</span></a>
-<a class="sourceLine" id="cb15-16" data-line-number="16"><span class="co">#&gt;  </span></a>
-<a class="sourceLine" id="cb15-17" data-line-number="17"><span class="co">#&gt;  Out-of-fold performance of all trained models:</span></a>
-<a class="sourceLine" id="cb15-18" data-line-number="18"><span class="co">#&gt;  </span></a>
-<a class="sourceLine" id="cb15-19" data-line-number="19"><span class="co">#&gt;  $`Random Forest`</span></a>
-<a class="sourceLine" id="cb15-20" data-line-number="20"><span class="co">#&gt;  # A tibble: 10 x 9</span></a>
-<a class="sourceLine" id="cb15-21" data-line-number="21"><span class="co">#&gt;    min.node.size  mtry splitrule   RMSE Rsquared   MAE RMSESD RsquaredSD</span></a>
-<a class="sourceLine" id="cb15-22" data-line-number="22"><span class="co">#&gt;  *         &lt;int&gt; &lt;int&gt; &lt;fct&gt;      &lt;dbl&gt;    &lt;dbl&gt; &lt;dbl&gt;  &lt;dbl&gt;      &lt;dbl&gt;</span></a>
-<a class="sourceLine" id="cb15-23" data-line-number="23"><span class="co">#&gt;  1            10    10 extratrees  9.07    0.404  6.43  0.640     0.0358</span></a>
-<a class="sourceLine" id="cb15-24" data-line-number="24"><span class="co">#&gt;  2             8    11 extratrees  9.09    0.402  6.43  0.626     0.0396</span></a>
-<a class="sourceLine" id="cb15-25" data-line-number="25"><span class="co">#&gt;  3            12     5 extratrees  9.13    0.405  6.56  0.666     0.0272</span></a>
-<a class="sourceLine" id="cb15-26" data-line-number="26"><span class="co">#&gt;  4            10    13 variance    9.33    0.376  6.60  0.633     0.0358</span></a>
-<a class="sourceLine" id="cb15-27" data-line-number="27"><span class="co">#&gt;  5             7    10 variance    9.34    0.374  6.61  0.583     0.0303</span></a>
-<a class="sourceLine" id="cb15-28" data-line-number="28"><span class="co">#&gt;  # ... with 5 more rows, and 1 more variable: MAESD &lt;dbl&gt;</span></a>
-<a class="sourceLine" id="cb15-29" data-line-number="29"><span class="co">#&gt;  </span></a>
-<a class="sourceLine" id="cb15-30" data-line-number="30"><span class="co">#&gt;  $`k-Nearest Neighbors`</span></a>
-<a class="sourceLine" id="cb15-31" data-line-number="31"><span class="co">#&gt;  # A tibble: 10 x 9</span></a>
-<a class="sourceLine" id="cb15-32" data-line-number="32"><span class="co">#&gt;     kmax distance kernel       RMSE Rsquared   MAE RMSESD RsquaredSD MAESD</span></a>
-<a class="sourceLine" id="cb15-33" data-line-number="33"><span class="co">#&gt;  * &lt;dbl&gt;    &lt;dbl&gt; &lt;fct&gt;       &lt;dbl&gt;    &lt;dbl&gt; &lt;dbl&gt;  &lt;dbl&gt;      &lt;dbl&gt; &lt;dbl&gt;</span></a>
-<a class="sourceLine" id="cb15-34" data-line-number="34"><span class="co">#&gt;  1   16.    2.60  inv          9.44    0.363  6.65  0.811     0.0649 0.551</span></a>
-<a class="sourceLine" id="cb15-35" data-line-number="35"><span class="co">#&gt;  2   14.    1.73  gaussian     9.44    0.361  6.66  0.717     0.0593 0.452</span></a>
-<a class="sourceLine" id="cb15-36" data-line-number="36"><span class="co">#&gt;  3   13.    1.58  triangular   9.49    0.355  6.66  0.764     0.0697 0.461</span></a>
-<a class="sourceLine" id="cb15-37" data-line-number="37"><span class="co">#&gt;  4   10.    0.933 rectangular  9.55    0.346  6.79  0.637     0.0438 0.412</span></a>
-<a class="sourceLine" id="cb15-38" data-line-number="38"><span class="co">#&gt;  5    6.    1.68  inv          9.64    0.340  6.74  0.723     0.0677 0.465</span></a>
-<a class="sourceLine" id="cb15-39" data-line-number="39"><span class="co">#&gt;  # ... with 5 more rows</span></a></code></pre></div>
+<a class="sourceLine" id="cb15-8" data-line-number="8"><span class="co"># &gt; Models trained: 2018-04-02 18:37:59</span></a>
+<a class="sourceLine" id="cb15-9" data-line-number="9"><span class="co"># &gt; </span></a>
+<a class="sourceLine" id="cb15-10" data-line-number="10"><span class="co"># &gt; Models tuned via 5-fold cross validation over 10 combinations of hyperparameter values.</span></a>
+<a class="sourceLine" id="cb15-11" data-line-number="11"><span class="co"># &gt; Best performance: RMSE = 9.07</span></a>
+<a class="sourceLine" id="cb15-12" data-line-number="12"><span class="co"># &gt; By Random Forest with hyperparameters:</span></a>
+<a class="sourceLine" id="cb15-13" data-line-number="13"><span class="co"># &gt;   mtry = 10</span></a>
+<a class="sourceLine" id="cb15-14" data-line-number="14"><span class="co"># &gt;   splitrule = extratrees</span></a>
+<a class="sourceLine" id="cb15-15" data-line-number="15"><span class="co"># &gt;   min.node.size = 10</span></a>
+<a class="sourceLine" id="cb15-16" data-line-number="16"><span class="co"># &gt; </span></a>
+<a class="sourceLine" id="cb15-17" data-line-number="17"><span class="co"># &gt; Out-of-fold performance of all trained models:</span></a>
+<a class="sourceLine" id="cb15-18" data-line-number="18"><span class="co"># &gt; </span></a>
+<a class="sourceLine" id="cb15-19" data-line-number="19"><span class="co"># &gt; $`Random Forest`</span></a>
+<a class="sourceLine" id="cb15-20" data-line-number="20"><span class="co"># &gt; # A tibble: 10 x 9</span></a>
+<a class="sourceLine" id="cb15-21" data-line-number="21"><span class="co"># &gt;   min.node.size  mtry splitrule   RMSE Rsquared   MAE RMSESD RsquaredSD</span></a>
+<a class="sourceLine" id="cb15-22" data-line-number="22"><span class="co"># &gt; *         &lt;int&gt; &lt;int&gt; &lt;fct&gt;      &lt;dbl&gt;    &lt;dbl&gt; &lt;dbl&gt;  &lt;dbl&gt;      &lt;dbl&gt;</span></a>
+<a class="sourceLine" id="cb15-23" data-line-number="23"><span class="co"># &gt; 1            10    10 extratrees  9.07    0.404  6.43  0.640     0.0358</span></a>
+<a class="sourceLine" id="cb15-24" data-line-number="24"><span class="co"># &gt; 2             8    11 extratrees  9.09    0.402  6.43  0.626     0.0396</span></a>
+<a class="sourceLine" id="cb15-25" data-line-number="25"><span class="co"># &gt; 3            12     5 extratrees  9.13    0.405  6.56  0.666     0.0272</span></a>
+<a class="sourceLine" id="cb15-26" data-line-number="26"><span class="co"># &gt; 4            10    13 variance    9.33    0.376  6.60  0.633     0.0358</span></a>
+<a class="sourceLine" id="cb15-27" data-line-number="27"><span class="co"># &gt; 5             7    10 variance    9.34    0.374  6.61  0.583     0.0303</span></a>
+<a class="sourceLine" id="cb15-28" data-line-number="28"><span class="co"># &gt; # ... with 5 more rows, and 1 more variable: MAESD &lt;dbl&gt;</span></a>
+<a class="sourceLine" id="cb15-29" data-line-number="29"><span class="co"># &gt; </span></a>
+<a class="sourceLine" id="cb15-30" data-line-number="30"><span class="co"># &gt; $`k-Nearest Neighbors`</span></a>
+<a class="sourceLine" id="cb15-31" data-line-number="31"><span class="co"># &gt; # A tibble: 10 x 9</span></a>
+<a class="sourceLine" id="cb15-32" data-line-number="32"><span class="co"># &gt;    kmax distance kernel       RMSE Rsquared   MAE RMSESD RsquaredSD MAESD</span></a>
+<a class="sourceLine" id="cb15-33" data-line-number="33"><span class="co"># &gt; * &lt;dbl&gt;    &lt;dbl&gt; &lt;fct&gt;       &lt;dbl&gt;    &lt;dbl&gt; &lt;dbl&gt;  &lt;dbl&gt;      &lt;dbl&gt; &lt;dbl&gt;</span></a>
+<a class="sourceLine" id="cb15-34" data-line-number="34"><span class="co"># &gt; 1   16.    2.60  inv          9.44    0.363  6.65  0.811     0.0649 0.551</span></a>
+<a class="sourceLine" id="cb15-35" data-line-number="35"><span class="co"># &gt; 2   14.    1.73  gaussian     9.44    0.361  6.66  0.717     0.0593 0.452</span></a>
+<a class="sourceLine" id="cb15-36" data-line-number="36"><span class="co"># &gt; 3   13.    1.58  triangular   9.49    0.355  6.66  0.764     0.0697 0.461</span></a>
+<a class="sourceLine" id="cb15-37" data-line-number="37"><span class="co"># &gt; 4   10.    0.933 rectangular  9.55    0.346  6.79  0.637     0.0438 0.412</span></a>
+<a class="sourceLine" id="cb15-38" data-line-number="38"><span class="co"># &gt; 5    6.    1.68  inv          9.64    0.340  6.74  0.723     0.0677 0.465</span></a>
+<a class="sourceLine" id="cb15-39" data-line-number="39"><span class="co"># &gt; # ... with 5 more rows</span></a></code></pre></div>
 <p>Let’s make a prediction on a hypothetical new patient. Note that the model handles missingness in <code>insulin</code> and a new category level in <code>weight_class</code> without a problem (but warns about it).</p>
 <div class="sourceCode" id="cb16"><pre class="sourceCode r"><code class="sourceCode r"><a class="sourceLine" id="cb16-1" data-line-number="1">new_patient &lt;-<span class="st"> </span><span class="kw">data.frame</span>(</a>
 <a class="sourceLine" id="cb16-2" data-line-number="2">  <span class="dt">pregnancies =</span> <span class="dv">0</span>,</a>
@@ -328,17 +328,17 @@ <h1 class="hasAnchor">
 <a class="sourceLine" id="cb16-8" data-line-number="8">  <span class="dt">pedigree =</span> <span class="fl">.2</span>,</a>
 <a class="sourceLine" id="cb16-9" data-line-number="9">  <span class="dt">diabetes =</span> <span class="st">"N"</span>)</a>
 <a class="sourceLine" id="cb16-10" data-line-number="10"><span class="kw">predict</span>(regression_models, new_patient)</a>
-<a class="sourceLine" id="cb16-11" data-line-number="11"><span class="co">#&gt;  Warning in ready_with_prep(object, newdata, mi): The following variables(s) had the following value(s) in predict that were not observed in training. </span></a>
-<a class="sourceLine" id="cb16-12" data-line-number="12"><span class="co">#&gt;      weight_class: ???</span></a>
-<a class="sourceLine" id="cb16-13" data-line-number="13"><span class="co">#&gt;  Prepping data based on provided recipe</span></a>
-<a class="sourceLine" id="cb16-14" data-line-number="14"><span class="co">#&gt;  "predicted_age" predicted by Random Forest last trained: 2018-04-02 11:00:50</span></a>
-<a class="sourceLine" id="cb16-15" data-line-number="15"><span class="co">#&gt;  Performance in training: RMSE = 9.07</span></a>
-<a class="sourceLine" id="cb16-16" data-line-number="16"><span class="co">#&gt;  # A tibble: 1 x 9</span></a>
-<a class="sourceLine" id="cb16-17" data-line-number="17"><span class="co">#&gt;    predicted_age pregnancies plasma_glucose diastolic_bp skinfold insulin</span></a>
-<a class="sourceLine" id="cb16-18" data-line-number="18"><span class="co">#&gt;  *         &lt;dbl&gt;       &lt;dbl&gt;          &lt;dbl&gt;        &lt;dbl&gt;    &lt;dbl&gt; &lt;lgl&gt;  </span></a>
-<a class="sourceLine" id="cb16-19" data-line-number="19"><span class="co">#&gt;  1          23.9          0.            80.          55.      24. NA     </span></a>
-<a class="sourceLine" id="cb16-20" data-line-number="20"><span class="co">#&gt;  # ... with 3 more variables: weight_class &lt;fct&gt;, pedigree &lt;dbl&gt;,</span></a>
-<a class="sourceLine" id="cb16-21" data-line-number="21"><span class="co">#&gt;  #   diabetes &lt;fct&gt;</span></a></code></pre></div>
+<a class="sourceLine" id="cb16-11" data-line-number="11"><span class="co"># &gt; Warning in ready_with_prep(object, newdata, mi): The following variables(s) had the following value(s) in predict that were not observed in training. </span></a>
+<a class="sourceLine" id="cb16-12" data-line-number="12"><span class="co"># &gt;     weight_class: ???</span></a>
+<a class="sourceLine" id="cb16-13" data-line-number="13"><span class="co"># &gt; Prepping data based on provided recipe</span></a>
+<a class="sourceLine" id="cb16-14" data-line-number="14"><span class="co"># &gt; "predicted_age" predicted by Random Forest last trained: 2018-04-02 18:37:59</span></a>
+<a class="sourceLine" id="cb16-15" data-line-number="15"><span class="co"># &gt; Performance in training: RMSE = 9.07</span></a>
+<a class="sourceLine" id="cb16-16" data-line-number="16"><span class="co"># &gt; # A tibble: 1 x 9</span></a>
+<a class="sourceLine" id="cb16-17" data-line-number="17"><span class="co"># &gt;   predicted_age pregnancies plasma_glucose diastolic_bp skinfold insulin</span></a>
+<a class="sourceLine" id="cb16-18" data-line-number="18"><span class="co"># &gt; *         &lt;dbl&gt;       &lt;dbl&gt;          &lt;dbl&gt;        &lt;dbl&gt;    &lt;dbl&gt; &lt;lgl&gt;  </span></a>
+<a class="sourceLine" id="cb16-19" data-line-number="19"><span class="co"># &gt; 1          23.9          0.            80.          55.      24. NA     </span></a>
+<a class="sourceLine" id="cb16-20" data-line-number="20"><span class="co"># &gt; # ... with 3 more variables: weight_class &lt;fct&gt;, pedigree &lt;dbl&gt;,</span></a>
+<a class="sourceLine" id="cb16-21" data-line-number="21"><span class="co"># &gt; #   diabetes &lt;fct&gt;</span></a></code></pre></div>
 </div>
   </div>
 
diff --git a/docs/dev/index.html b/docs/dev/index.html
index 9d777463b..e0c00f37d 100644
--- a/docs/dev/index.html
+++ b/docs/dev/index.html
@@ -93,7 +93,7 @@
 
     
     
-<!-- README.md is generated from README.Rmd. Please edit that file -->
+<!-- README.md is generated from README.Rmd. Please edit the .Rmd and knit it to generate the .md. -->
 <div id="healthcareai" class="section level1">
 <div class="page-header"><h1 class="hasAnchor">
 <a href="#healthcareai" class="anchor"></a>healthcareai <img src="reference/figures/logo.png" align="right">
@@ -127,19 +127,19 @@ <h2 class="hasAnchor">
 <a class="sourceLine" id="cb1-6" data-line-number="6"><span class="co"># &gt; Performance Metric: ROC</span></a>
 <a class="sourceLine" id="cb1-7" data-line-number="7"><span class="co"># &gt; Number of Observations: 768</span></a>
 <a class="sourceLine" id="cb1-8" data-line-number="8"><span class="co"># &gt; Number of Features: 12</span></a>
-<a class="sourceLine" id="cb1-9" data-line-number="9"><span class="co"># &gt; Models Trained: 2018-04-02 10:58:57 </span></a>
+<a class="sourceLine" id="cb1-9" data-line-number="9"><span class="co"># &gt; Models Trained: 2018-04-02 18:36:14 </span></a>
 <a class="sourceLine" id="cb1-10" data-line-number="10"><span class="co"># &gt; </span></a>
-<a class="sourceLine" id="cb1-11" data-line-number="11"><span class="co"># &gt; Models tuned via 5-fold cross validation over 10 combinations of hyperparameter values.</span></a>
+<a class="sourceLine" id="cb1-11" data-line-number="11"><span class="co"># &gt; Models tuned via 5-fold cross validation over 9 combinations of hyperparameter values.</span></a>
 <a class="sourceLine" id="cb1-12" data-line-number="12"><span class="co"># &gt; Best model: Random Forest</span></a>
-<a class="sourceLine" id="cb1-13" data-line-number="13"><span class="co"># &gt; ROC = 0.84</span></a>
+<a class="sourceLine" id="cb1-13" data-line-number="13"><span class="co"># &gt; ROC = 0.85</span></a>
 <a class="sourceLine" id="cb1-14" data-line-number="14"><span class="co"># &gt; Optimal hyperparameter values:</span></a>
-<a class="sourceLine" id="cb1-15" data-line-number="15"><span class="co"># &gt;   mtry = 2</span></a>
+<a class="sourceLine" id="cb1-15" data-line-number="15"><span class="co"># &gt;   mtry = 5</span></a>
 <a class="sourceLine" id="cb1-16" data-line-number="16"><span class="co"># &gt;   splitrule = extratrees</span></a>
-<a class="sourceLine" id="cb1-17" data-line-number="17"><span class="co"># &gt;   min.node.size = 8</span></a></code></pre></div>
+<a class="sourceLine" id="cb1-17" data-line-number="17"><span class="co"># &gt;   min.node.size = 11</span></a></code></pre></div>
 <p>Make predictions and examine predictive performance:</p>
 <div class="sourceCode" id="cb2"><pre class="sourceCode r"><code class="sourceCode r"><a class="sourceLine" id="cb2-1" data-line-number="1">predictions &lt;-<span class="st"> </span><span class="kw">predict</span>(models)</a>
 <a class="sourceLine" id="cb2-2" data-line-number="2"><span class="kw">plot</span>(predictions)</a></code></pre></div>
-<p><img src="index_files/figure-html/unnamed-chunk-3-1.png" width="576"></p>
+<p><img src="reference/figures/README-plot_predictions-1.png" width="576"></p>
 </div>
 <div id="learn-more" class="section level2">
 <h2 class="hasAnchor">
diff --git a/docs/dev/index_files/figure-html/unnamed-chunk-3-1.png b/docs/dev/index_files/figure-html/unnamed-chunk-3-1.png
index 968599a95..811753174 100644
Binary files a/docs/dev/index_files/figure-html/unnamed-chunk-3-1.png and b/docs/dev/index_files/figure-html/unnamed-chunk-3-1.png differ
diff --git a/docs/dev/reference/figures/README-plot predictions-1.png b/docs/dev/reference/figures/README-plot predictions-1.png
new file mode 100644
index 000000000..13fbefd95
Binary files /dev/null and b/docs/dev/reference/figures/README-plot predictions-1.png differ
diff --git a/docs/dev/reference/figures/README-plot_predictions-1.png b/docs/dev/reference/figures/README-plot_predictions-1.png
new file mode 100644
index 000000000..5816c4544
Binary files /dev/null and b/docs/dev/reference/figures/README-plot_predictions-1.png differ
diff --git a/docs/dev/reference/flash_models.html b/docs/dev/reference/flash_models.html
index 3ad2b0894..5ede582f2 100644
--- a/docs/dev/reference/flash_models.html
+++ b/docs/dev/reference/flash_models.html
@@ -186,10 +186,9 @@ <h2 class="hasAnchor" id="value"><a class="anchor" href="#value"></a>Value</h2>
     <h2 class="hasAnchor" id="details"><a class="anchor" href="#details"></a>Details</h2>
 
     <p>This function has two major differences from
-  <code><a href='tune_models.html'>tune_models</a></code>:</p><ol>
-<li><p>It is much
-  faster.</p></li>
-</ol>
+  <code><a href='tune_models.html'>tune_models</a></code>: 1. It uses fixed hyperparameter values to train
+  models instead of using cross-validation to optimize hyperparameter values
+  for predictive performance, and, as a result, 2. It is much faster.</p>
     
     <h2 class="hasAnchor" id="see-also"><a class="anchor" href="#see-also"></a>See also</h2>
 
@@ -198,24 +197,13 @@ <h2 class="hasAnchor" id="see-also"><a class="anchor" href="#see-also"></a>See a
     
 
     <h2 class="hasAnchor" id="examples"><a class="anchor" href="#examples"></a>Examples</h2>
-    <pre class="examples"><div class='input'><span class='co'># Prepare data</span>
-<span class='no'>prepped_data</span> <span class='kw'>&lt;-</span> <span class='fu'><a href='prep_data.html'>prep_data</a></span>(<span class='no'>pima_diabetes</span>, <span class='no'>patient_id</span>, <span class='kw'>outcome</span> <span class='kw'>=</span> <span class='no'>diabetes</span>)</div><div class='output co'>#&gt; <span class='message'>Training new data prep recipe</span></div><div class='input'>
+    <pre class="examples"><span class='co'># NOT RUN {</span>
+<span class='co'># Prepare data</span>
+<span class='no'>prepped_data</span> <span class='kw'>&lt;-</span> <span class='fu'><a href='prep_data.html'>prep_data</a></span>(<span class='no'>pima_diabetes</span>, <span class='no'>patient_id</span>, <span class='kw'>outcome</span> <span class='kw'>=</span> <span class='no'>diabetes</span>)
+
 <span class='co'># Simplest use. Get models quickly at default hyperparameter values</span>
-<span class='fu'>flash_models</span>(<span class='no'>prepped_data</span>, <span class='no'>diabetes</span>)</div><div class='output co'>#&gt; <span class='message'>Variable(s) ignored in prep_data won't be used to tune models: patient_id</span></div><div class='output co'>#&gt; <span class='message'>diabetes looks categorical, so training classification algorithms.</span></div><div class='output co'>#&gt; Algorithms Trained: Random Forest, k-Nearest Neighbors
-#&gt; Target: diabetes
-#&gt; Class: Classification
-#&gt; Performance Metric: ROC
-#&gt; Number of Observations: 768
-#&gt; Number of Features: 12
-#&gt; Models Trained: 2018-04-02 10:59:04 
-#&gt; 
-#&gt; Models have not been tuned. Performance estimated via 5-fold cross validation at fixed hyperparameter values.
-#&gt; Best model: Random Forest
-#&gt; ROC = 0.84
-#&gt; User-selected hyperparameter values:
-#&gt;   mtry = 5
-#&gt;   splitrule = extratrees
-#&gt;   min.node.size = 10 </div><div class='input'>
+<span class='fu'>flash_models</span>(<span class='no'>prepped_data</span>, <span class='no'>diabetes</span>)
+
 <span class='co'># Set non-default hyperparameter values by passing a list of lists to \code{hyperparameters}</span>
 <span class='no'>models</span> <span class='kw'>&lt;-</span>
   <span class='fu'>flash_models</span>(<span class='kw'>d</span> <span class='kw'>=</span> <span class='no'>prepped_data</span>,
@@ -232,35 +220,18 @@ <h2 class="hasAnchor" id="examples"><a class="anchor" href="#examples"></a>Examp
                    <span class='kw'>kernel</span> <span class='kw'>=</span> <span class='st'>"gaussian"</span>
                  )
                )
-  )</div><div class='output co'>#&gt; <span class='message'>Variable(s) ignored in prep_data won't be used to tune models: patient_id</span></div><div class='output co'>#&gt; <span class='message'>diabetes looks categorical, so training classification algorithms.</span></div><div class='input'><span class='fu'>summary</span>(<span class='no'>models</span>)</div><div class='output co'>#&gt; Models trained: 2018-04-02 10:59:06
-#&gt; 
-#&gt; Models have not been tuned. Performance estimated via 5-fold cross validation at fixed hyperparameter values.
-#&gt; Best algorithm: Random Forest with ROC = 0.84
-#&gt; 
-#&gt; Out-of-fold performance of all trained models:
-#&gt; 
-#&gt; $`Random Forest`
-#&gt; # A tibble: 1 x 9
-#&gt;    mtry splitrule min.node.size   ROC  Sens  Spec  ROCSD SensSD SpecSD
-#&gt; * &lt;dbl&gt; &lt;fct&gt;             &lt;dbl&gt; &lt;dbl&gt; &lt;dbl&gt; &lt;dbl&gt;  &lt;dbl&gt;  &lt;dbl&gt;  &lt;dbl&gt;
-#&gt; 1    3. gini                 1. 0.836 0.868 0.590 0.0313 0.0466 0.0602
-#&gt; 
-#&gt; $`k-Nearest Neighbors`
-#&gt; # A tibble: 1 x 9
-#&gt;    kmax distance kernel     ROC  Sens  Spec  ROCSD SensSD SpecSD
-#&gt; * &lt;dbl&gt;    &lt;dbl&gt; &lt;fct&gt;    &lt;dbl&gt; &lt;dbl&gt; &lt;dbl&gt;  &lt;dbl&gt;  &lt;dbl&gt;  &lt;dbl&gt;
-#&gt; 1    3.       2. gaussian 0.784 0.828 0.593 0.0165 0.0286 0.0564
-#&gt; </div><div class='input'>
-# Speed comparison of no tuning with flash_models vs. tuning with tune_models:
-</div><span class='co'># NOT RUN {</span>
-  <span class='co'># ~40 seconds:</span>
-  <span class='fu'>system.time</span>(
-    <span class='fu'><a href='tune_models.html'>tune_models</a></span>(<span class='no'>prepped_data</span>, <span class='no'>diabetes</span>)
-  )
-  <span class='co'># ~6 seconds:</span>
-  <span class='fu'>system.time</span>(
-    <span class='fu'>flash_models</span>(<span class='no'>prepped_data</span>, <span class='no'>diabetes</span>)
   )
+<span class='fu'>summary</span>(<span class='no'>models</span>)
+
+<span class='co'># Speed comparison of no tuning with flash_models vs. tuning with tune_models:</span>
+<span class='co'># ~40 seconds:</span>
+<span class='fu'>system.time</span>(
+  <span class='fu'><a href='tune_models.html'>tune_models</a></span>(<span class='no'>prepped_data</span>, <span class='no'>diabetes</span>)
+)
+<span class='co'># ~6 seconds:</span>
+<span class='fu'>system.time</span>(
+  <span class='fu'>flash_models</span>(<span class='no'>prepped_data</span>, <span class='no'>diabetes</span>)
+)
 <span class='co'># }</span></pre>
   </div>
   <div class="col-md-3 hidden-xs hidden-sm" id="sidebar">
diff --git a/docs/dev/reference/hcai_impute.html b/docs/dev/reference/hcai_impute.html
index 246fdbf6c..08eb9d248 100644
--- a/docs/dev/reference/hcai_impute.html
+++ b/docs/dev/reference/hcai_impute.html
@@ -179,8 +179,17 @@ <h2 class="hasAnchor" id="value"><a class="anchor" href="#value"></a>Value</h2>
     
 
     <h2 class="hasAnchor" id="examples"><a class="anchor" href="#examples"></a>Examples</h2>
-    <pre class="examples"><div class='input'><span class='fu'>library</span>(<span class='no'>recipes</span>)
-
+    <pre class="examples"><div class='input'><span class='fu'>library</span>(<span class='no'>recipes</span>)</div><div class='output co'>#&gt; <span class='message'>Loading required package: dplyr</span></div><div class='output co'>#&gt; <span class='message'></span>
+#&gt; <span class='message'>Attaching package: ‘dplyr’</span></div><div class='output co'>#&gt; <span class='message'>The following object is masked from ‘package:testthat’:</span>
+#&gt; <span class='message'></span>
+#&gt; <span class='message'>    matches</span></div><div class='output co'>#&gt; <span class='message'>The following objects are masked from ‘package:stats’:</span>
+#&gt; <span class='message'></span>
+#&gt; <span class='message'>    filter, lag</span></div><div class='output co'>#&gt; <span class='message'>The following objects are masked from ‘package:base’:</span>
+#&gt; <span class='message'></span>
+#&gt; <span class='message'>    intersect, setdiff, setequal, union</span></div><div class='output co'>#&gt; <span class='message'>Loading required package: broom</span></div><div class='output co'>#&gt; <span class='message'></span>
+#&gt; <span class='message'>Attaching package: ‘recipes’</span></div><div class='output co'>#&gt; <span class='message'>The following object is masked from ‘package:stats’:</span>
+#&gt; <span class='message'></span>
+#&gt; <span class='message'>    step</span></div><div class='input'>
 <span class='no'>n</span> <span class='kw'>=</span> <span class='fl'>100</span>
 <span class='fu'>set.seed</span>(<span class='fl'>9</span>)
 <span class='no'>d</span> <span class='kw'>&lt;-</span> <span class='kw pkg'>tibble</span><span class='kw ns'>::</span><span class='fu'><a href='http://www.rdocumentation.org/packages/tibble/topics/tibble'>tibble</a></span>(<span class='kw'>patient_id</span> <span class='kw'>=</span> <span class='fl'>1</span>:<span class='no'>n</span>,
diff --git a/docs/dev/reference/machine_learn-1.png b/docs/dev/reference/machine_learn-1.png
new file mode 100644
index 000000000..0e370e8d7
Binary files /dev/null and b/docs/dev/reference/machine_learn-1.png differ
diff --git a/docs/dev/reference/machine_learn.html b/docs/dev/reference/machine_learn.html
index 7c63e081d..7b864cf2a 100644
--- a/docs/dev/reference/machine_learn.html
+++ b/docs/dev/reference/machine_learn.html
@@ -192,70 +192,88 @@ <h2 class="hasAnchor" id="details"><a class="anchor" href="#details"></a>Details
     
 
     <h2 class="hasAnchor" id="examples"><a class="anchor" href="#examples"></a>Examples</h2>
-    <pre class="examples"><div class='input'><span class='co'># Split data into training and test sets using a subset of the data for speed</span>
-<span class='no'>training_data</span> <span class='kw'>&lt;-</span> <span class='no'>pima_diabetes</span>[<span class='fl'>1</span>:<span class='fl'>50</span>, ]
-<span class='no'>test_data</span> <span class='kw'>&lt;-</span> <span class='no'>pima_diabetes</span>[<span class='fl'>51</span>:<span class='fl'>60</span>, ]
+    <pre class="examples"><div class='input'><span class='co'># Split the data into training and test sets, using just 100 rows for speed</span>
+<span class='no'>d</span> <span class='kw'>&lt;-</span> <span class='fu'><a href='split_train_test.html'>split_train_test</a></span>(<span class='kw'>d</span> <span class='kw'>=</span> <span class='no'>pima_diabetes</span>[<span class='fl'>1</span>:<span class='fl'>100</span>, ],
+                      <span class='kw'>outcome</span> <span class='kw'>=</span> <span class='no'>diabetes</span>,
+                      <span class='kw'>percent_train</span> <span class='kw'>=</span> <span class='fl'>.9</span>)
 
 <span class='co'>### Classification ###</span>
 
-<span class='co'># Clean and prep the data, tune algorithms over hyperparameter values to predict diabetes</span>
-<span class='no'>diabetes_models</span> <span class='kw'>&lt;-</span> <span class='fu'>machine_learn</span>(<span class='no'>training_data</span>, <span class='kw'>outcome</span> <span class='kw'>=</span> <span class='no'>diabetes</span>)</div><div class='output co'>#&gt; <span class='message'>Training new data prep recipe</span></div><div class='output co'>#&gt; <span class='message'>diabetes looks categorical, so training classification algorithms.</span></div><div class='output co'>#&gt; <span class='message'>Running cross validation for Random Forest</span></div><div class='output co'>#&gt; <span class='message'>Running cross validation for k-Nearest Neighbors</span></div><div class='input'>
+<span class='co'># Clean and prep the training data, specifying that patient_id is an ID column,</span>
+<span class='co'># and tune algorithms over hyperparameter values to predict diabetes</span>
+<span class='no'>diabetes_models</span> <span class='kw'>&lt;-</span> <span class='fu'>machine_learn</span>(<span class='no'>d</span>$<span class='no'>train</span>, <span class='no'>patient_id</span>, <span class='kw'>outcome</span> <span class='kw'>=</span> <span class='no'>diabetes</span>)</div><div class='output co'>#&gt; <span class='message'>Training new data prep recipe</span></div><div class='output co'>#&gt; <span class='message'>Variable(s) ignored in prep_data won't be used to tune models: patient_id</span></div><div class='output co'>#&gt; <span class='message'>diabetes looks categorical, so training classification algorithms.</span></div><div class='output co'>#&gt; <span class='message'>Running cross validation for Random Forest</span></div><div class='output co'>#&gt; <span class='message'>Running cross validation for k-Nearest Neighbors</span></div><div class='input'>
+<span class='co'># Inspect model specification and performance</span>
+<span class='no'>diabetes_models</span></div><div class='output co'>#&gt; Algorithms Trained: Random Forest, k-Nearest Neighbors
+#&gt; Target: diabetes
+#&gt; Class: Classification
+#&gt; Performance Metric: ROC
+#&gt; Number of Observations: 91
+#&gt; Number of Features: 12
+#&gt; Models Trained: 2018-04-02 18:36:30 
+#&gt; 
+#&gt; Models tuned via 5-fold cross validation over 10 combinations of hyperparameter values.
+#&gt; Best model: Random Forest
+#&gt; ROC = 0.77
+#&gt; Optimal hyperparameter values:
+#&gt;   mtry = 4
+#&gt;   splitrule = gini
+#&gt;   min.node.size = 9 </div><div class='input'>
 <span class='co'># Make predictions (predicted probability of diabetes) on test data</span>
-<span class='fu'>predict</span>(<span class='no'>diabetes_models</span>, <span class='no'>test_data</span>)</div><div class='output co'>#&gt; <span class='message'>Prepping data based on provided recipe</span></div><div class='output co'>#&gt; <span class='message'>"predicted_diabetes" predicted by Random Forest last trained: 2018-04-02 10:59:13</span>
-#&gt; <span class='message'>Performance in training: ROC = 0.75</span></div><div class='output co'>#&gt; # A tibble: 10 x 11
-#&gt;    diabetes predicted_diabe… patient_id pregnancies plasma_glucose diastolic_bp
-#&gt;  * &lt;chr&gt;               &lt;dbl&gt;      &lt;int&gt;       &lt;int&gt;          &lt;int&gt;        &lt;int&gt;
-#&gt;  1 N                   0.255         51           1            103           80
-#&gt;  2 N                   0.278         52           1            101           50
-#&gt;  3 N                   0.260         53           5             88           66
-#&gt;  4 Y                   0.663         54           8            176           90
-#&gt;  5 N                   0.716         55           7            150           66
-#&gt;  6 N                   0.267         56           1             73           50
-#&gt;  7 Y                   0.706         57           7            187           68
-#&gt;  8 N                   0.558         58           0            100           88
-#&gt;  9 N                   0.503         59           0            146           82
-#&gt; 10 N                   0.432         60           0            105           64
+<span class='fu'>predict</span>(<span class='no'>diabetes_models</span>, <span class='no'>d</span>$<span class='no'>test</span>)</div><div class='output co'>#&gt; <span class='message'>Prepping data based on provided recipe</span></div><div class='output co'>#&gt; <span class='message'>"predicted_diabetes" predicted by Random Forest last trained: 2018-04-02 18:36:30</span>
+#&gt; <span class='message'>Performance in training: ROC = 0.77</span></div><div class='output co'>#&gt; # A tibble: 9 x 11
+#&gt;   diabetes predicted_diabet… patient_id pregnancies plasma_glucose diastolic_bp
+#&gt; * &lt;chr&gt;                &lt;dbl&gt;      &lt;int&gt;       &lt;int&gt;          &lt;int&gt;        &lt;int&gt;
+#&gt; 1 Y                    0.196          7           3             78           50
+#&gt; 2 Y                    0.567         17           0            118           84
+#&gt; 3 N                    0.581         31           5            109           75
+#&gt; 4 N                    0.478         36           4            103           60
+#&gt; 5 N                    0.335         47           1            146           56
+#&gt; 6 N                    0.189         70           4            146           85
+#&gt; 7 Y                    0.379         73          13            126           90
+#&gt; 8 N                    0.377         78           5             95           72
+#&gt; 9 N                    0.176         83           7             83           78
 #&gt; # ... with 5 more variables: skinfold &lt;int&gt;, insulin &lt;int&gt;, weight_class &lt;chr&gt;,
 #&gt; #   pedigree &lt;dbl&gt;, age &lt;int&gt;</div><div class='input'>
 <span class='co'>### Regression ###</span>
 
-<span class='co'># Predict numeric outcomes simply by specifying the name of the outcome variable</span>
-<span class='no'>age_model</span> <span class='kw'>&lt;-</span> <span class='fu'>machine_learn</span>(<span class='no'>training_data</span>, <span class='kw'>outcome</span> <span class='kw'>=</span> <span class='no'>age</span>)</div><div class='output co'>#&gt; <span class='message'>Training new data prep recipe</span></div><div class='output co'>#&gt; <span class='message'>age looks numeric, so training regression algorithms.</span></div><div class='output co'>#&gt; <span class='message'>Running cross validation for Random Forest</span></div><div class='output co'>#&gt; <span class='message'>Running cross validation for k-Nearest Neighbors</span></div><div class='input'>
-<span class='co'># If new data isn't specifed, get predictions on training data. Plot predictions</span>
-<span class='fu'>predict</span>(<span class='no'>age_model</span>)</div><div class='output co'>#&gt; <span class='message'>"predicted_age" predicted by Random Forest last trained: 2018-04-02 10:59:16</span>
-#&gt; <span class='message'>Performance in training: RMSE = 9.88</span></div><div class='output co'>#&gt; # A tibble: 50 x 17
-#&gt;      age predicted_age patient_id pregnancies plasma_glucose diastolic_bp
-#&gt;  * &lt;int&gt;         &lt;dbl&gt;      &lt;int&gt;       &lt;int&gt;          &lt;int&gt;        &lt;dbl&gt;
-#&gt;  1    50          44.1          1           6            148         72.0
-#&gt;  2    31          29.0          2           1             85         66.0
-#&gt;  3    32          36.4          3           8            183         64.0
-#&gt;  4    21          25.1          4           1             89         66.0
-#&gt;  5    33          33.3          5           0            137         40.0
-#&gt;  6    30          32.5          6           5            116         74.0
-#&gt;  7    26          27.8          7           3             78         50.0
-#&gt;  8    29          33.6          8          10            115         73.6
-#&gt;  9    53          47.8          9           2            197         70.0
-#&gt; 10    54          46.9         10           8            125         96.0
-#&gt; # ... with 40 more rows, and 11 more variables: skinfold &lt;dbl&gt;, insulin &lt;dbl&gt;,
-#&gt; #   pedigree &lt;dbl&gt;, weight_class_normal &lt;dbl&gt;, weight_class_obese &lt;dbl&gt;,
+<span class='co'># If the outcome variable is numeric, regression models will be trained</span>
+<span class='no'>age_model</span> <span class='kw'>&lt;-</span> <span class='fu'>machine_learn</span>(<span class='no'>d</span>$<span class='no'>train</span>, <span class='no'>patient_id</span>, <span class='kw'>outcome</span> <span class='kw'>=</span> <span class='no'>age</span>)</div><div class='output co'>#&gt; <span class='message'>Training new data prep recipe</span></div><div class='output co'>#&gt; <span class='message'>Variable(s) ignored in prep_data won't be used to tune models: patient_id</span></div><div class='output co'>#&gt; <span class='message'>age looks numeric, so training regression algorithms.</span></div><div class='output co'>#&gt; <span class='message'>Running cross validation for Random Forest</span></div><div class='output co'>#&gt; <span class='message'>Running cross validation for k-Nearest Neighbors</span></div><div class='input'>
+<span class='co'># If new data isn't specifed, get predictions on training data</span>
+<span class='fu'>predict</span>(<span class='no'>age_model</span>)</div><div class='output co'>#&gt; <span class='message'>"predicted_age" predicted by Random Forest last trained: 2018-04-02 18:36:34</span>
+#&gt; <span class='message'>Performance in training: RMSE = 8.84</span></div><div class='output co'>#&gt; # A tibble: 91 x 16
+#&gt;      age predicted_age pregnancies plasma_glucose diastolic_bp skinfold insulin
+#&gt;  * &lt;int&gt;         &lt;dbl&gt;       &lt;int&gt;          &lt;dbl&gt;        &lt;dbl&gt;    &lt;dbl&gt;   &lt;dbl&gt;
+#&gt;  1    50          43.0           6           148.         72.0     35.0   169. 
+#&gt;  2    31          25.4           1            85.         66.0     29.0   169. 
+#&gt;  3    32          41.5           8           183.         64.0     29.0   169. 
+#&gt;  4    21          24.3           1            89.         66.0     23.0    94.0
+#&gt;  5    33          33.0           0           137.         40.0     35.0   168. 
+#&gt;  6    30          31.4           5           116.         74.0     29.0   169. 
+#&gt;  7    29          37.6          10           115.         72.4     29.0   169. 
+#&gt;  8    53          47.7           2           197.         70.0     45.0   543. 
+#&gt;  9    54          45.6           8           125.         96.0     29.0   169. 
+#&gt; 10    30          33.2           4           110.         92.0     29.0   169. 
+#&gt; # ... with 81 more rows, and 9 more variables: pedigree &lt;dbl&gt;,
+#&gt; #   weight_class_normal &lt;dbl&gt;, weight_class_obese &lt;dbl&gt;,
 #&gt; #   weight_class_overweight &lt;dbl&gt;, weight_class_hcai_missing &lt;dbl&gt;,
 #&gt; #   weight_class_other &lt;dbl&gt;, diabetes_Y &lt;dbl&gt;, diabetes_other &lt;dbl&gt;,
 #&gt; #   diabetes_hcai_missing &lt;dbl&gt;</div><div class='input'>
 <span class='co'>### Faster model training without tuning hyperparameters ###</span>
 
-<span class='co'># Train models at set hyperparameter values by setting tune to FALSE.</span>
-<span class='co'># This is faster (especially on larger datasets), but produces models with less predictive accuracy.</span>
-<span class='fu'>machine_learn</span>(<span class='no'>training_data</span>, <span class='kw'>outcome</span> <span class='kw'>=</span> <span class='no'>diabetes</span>, <span class='kw'>tune</span> <span class='kw'>=</span> <span class='fl'>FALSE</span>)</div><div class='output co'>#&gt; <span class='message'>Training new data prep recipe</span></div><div class='output co'>#&gt; <span class='message'>diabetes looks categorical, so training classification algorithms.</span></div><div class='output co'>#&gt; Algorithms Trained: Random Forest, k-Nearest Neighbors
+<span class='co'># Train models at set hyperparameter values by setting tune to FALSE. This is</span>
+<span class='co'># faster (especially on larger datasets), but produces models with less</span>
+<span class='co'># predictive accuracy.</span>
+<span class='fu'>machine_learn</span>(<span class='no'>d</span>$<span class='no'>train</span>, <span class='no'>patient_id</span>, <span class='kw'>outcome</span> <span class='kw'>=</span> <span class='no'>diabetes</span>, <span class='kw'>tune</span> <span class='kw'>=</span> <span class='fl'>FALSE</span>)</div><div class='output co'>#&gt; <span class='message'>Training new data prep recipe</span></div><div class='output co'>#&gt; <span class='message'>Variable(s) ignored in prep_data won't be used to tune models: patient_id</span></div><div class='output co'>#&gt; <span class='message'>diabetes looks categorical, so training classification algorithms.</span></div><div class='output co'>#&gt; Algorithms Trained: Random Forest, k-Nearest Neighbors
 #&gt; Target: diabetes
 #&gt; Class: Classification
 #&gt; Performance Metric: ROC
-#&gt; Number of Observations: 50
-#&gt; Number of Features: 13
-#&gt; Models Trained: 2018-04-02 10:59:18 
+#&gt; Number of Observations: 91
+#&gt; Number of Features: 12
+#&gt; Models Trained: 2018-04-02 18:36:36 
 #&gt; 
 #&gt; Models have not been tuned. Performance estimated via 5-fold cross validation at fixed hyperparameter values.
 #&gt; Best model: Random Forest
-#&gt; ROC = 0.67
+#&gt; ROC = 0.77
 #&gt; User-selected hyperparameter values:
 #&gt;   mtry = 5
 #&gt;   splitrule = extratrees
diff --git a/docs/dev/reference/pivot.html b/docs/dev/reference/pivot.html
index 7daa28b15..7908fa2b1 100644
--- a/docs/dev/reference/pivot.html
+++ b/docs/dev/reference/pivot.html
@@ -226,26 +226,26 @@ <h2 class="hasAnchor" id="examples"><a class="anchor" href="#examples"></a>Examp
 <span class='no'>bills</span></div><div class='output co'>#&gt; # A tibble: 8 x 4
 #&gt;   patient_id dept_id charge date      
 #&gt;   &lt;chr&gt;      &lt;chr&gt;    &lt;dbl&gt; &lt;date&gt;    
-#&gt; 1 A          ED       9051. 2024-12-24
-#&gt; 2 A          ICU      4995. 2024-12-25
-#&gt; 3 A          ED       2687. 2024-12-25
-#&gt; 4 A          ICU      5475. 2024-12-23
-#&gt; 5 B          ED       8745. 2024-12-24
-#&gt; 6 B          ICU      9077. 2024-12-23
-#&gt; 7 B          ED       3351. 2024-12-23
-#&gt; 8 B          ICU      7358. 2024-12-25</div><div class='input'>
+#&gt; 1 A          ED       2410. 2024-12-23
+#&gt; 2 A          ICU      9265. 2024-12-24
+#&gt; 3 A          ED        118. 2024-12-24
+#&gt; 4 A          ICU      1650. 2024-12-24
+#&gt; 5 B          ED       3184. 2024-12-25
+#&gt; 6 B          ICU      4829. 2024-12-24
+#&gt; 7 B          ED        196. 2024-12-23
+#&gt; 8 B          ICU      2433. 2024-12-25</div><div class='input'>
 <span class='co'># Total charges per patient x department:</span>
 <span class='fu'>pivot</span>(<span class='no'>bills</span>, <span class='no'>patient_id</span>, <span class='no'>dept_id</span>, <span class='no'>charge</span>, <span class='no'>sum</span>)</div><div class='output co'>#&gt; # A tibble: 2 x 3
 #&gt;   patient_id dept_id_ED dept_id_ICU
 #&gt;   &lt;fct&gt;           &lt;dbl&gt;       &lt;dbl&gt;
-#&gt; 1 A              11738.      10471.
-#&gt; 2 B              12096.      16435.</div><div class='input'>
+#&gt; 1 A               2528.      10915.
+#&gt; 2 B               3381.       7262.</div><div class='input'>
 <span class='co'># Count of charges per patient x day:</span>
 <span class='fu'>pivot</span>(<span class='no'>bills</span>, <span class='no'>patient_id</span>, <span class='no'>date</span>)</div><div class='output co'>#&gt; <span class='message'>No fill column was provided, so using "1" for present entities</span></div><div class='output co'>#&gt; <span class='message'>There are rows that contain the same values of both patient_id and date but you didn't provide a function to 'fun' for their aggregation. Proceeding with the default: fun = sum.</span></div><div class='output co'>#&gt; # A tibble: 2 x 4
 #&gt;   patient_id `date_2024-12-23` `date_2024-12-24` `date_2024-12-25`
 #&gt;   &lt;fct&gt;                  &lt;int&gt;             &lt;int&gt;             &lt;int&gt;
-#&gt; 1 A                          1                 1                 2
-#&gt; 2 B                          2                 1                 1</div><div class='input'>
+#&gt; 1 A                          1                 3                NA
+#&gt; 2 B                          1                 1                 2</div><div class='input'>
 <span class='co'># Can provide a custom function to fun, which will take fill as input.</span>
 <span class='co'># Get the difference between the greatest and smallest charge in each</span>
 <span class='co'># department for each patient and format it as currency.</span>
@@ -257,8 +257,8 @@ <h2 class="hasAnchor" id="examples"><a class="anchor" href="#examples"></a>Examp
 )</div><div class='output co'>#&gt; # A tibble: 2 x 3
 #&gt;   patient_id dept_id_ED dept_id_ICU
 #&gt;   &lt;fct&gt;      &lt;chr&gt;      &lt;chr&gt;      
-#&gt; 1 A          $6364.57   $479.92    
-#&gt; 2 B          $5393.72   $1718.13   </div></pre>
+#&gt; 1 A          $2292.21   $7614.78   
+#&gt; 2 B          $2987.89   $2395.96   </div></pre>
   </div>
   <div class="col-md-3 hidden-xs hidden-sm" id="sidebar">
     <h2>Contents</h2>
diff --git a/docs/dev/reference/plot.hcai_predicted_df-1.png b/docs/dev/reference/plot.hcai_predicted_df-1.png
index 0a7d1a7aa..0785f4ff7 100644
Binary files a/docs/dev/reference/plot.hcai_predicted_df-1.png and b/docs/dev/reference/plot.hcai_predicted_df-1.png differ
diff --git a/docs/dev/reference/plot.hcai_predicted_df-2.png b/docs/dev/reference/plot.hcai_predicted_df-2.png
index 898c82c8a..f39d00fb5 100644
Binary files a/docs/dev/reference/plot.hcai_predicted_df-2.png and b/docs/dev/reference/plot.hcai_predicted_df-2.png differ
diff --git a/docs/dev/reference/plot.hcai_predicted_df.html b/docs/dev/reference/plot.hcai_predicted_df.html
index d66bfbc7d..ecd22a889 100644
--- a/docs/dev/reference/plot.hcai_predicted_df.html
+++ b/docs/dev/reference/plot.hcai_predicted_df.html
@@ -162,14 +162,15 @@ <h2 class="hasAnchor" id="value"><a class="anchor" href="#value"></a>Value</h2>
     <h2 class="hasAnchor" id="details"><a class="anchor" href="#details"></a>Details</h2>
 
     <p>The following arguments can be provided to customize the plot: For
-  regression: title, point_size, point_alpha, font_size. For
-  classification: title, fill_colors, fill_alpha, curve_flex, font_size. For
-  details on how to use them, see <code><a href='plot_regression_predictions.html'>plot_regression_predictions</a></code>
-  or <code><a href='plot_classification_predictions.html'>plot_classification_predictions</a></code>.</p>
+  regression: title, point_size, point_alpha, font_size. For classification:
+  title, fill_colors, fill_alpha, curve_flex, font_size. For details on how
+  to use them, see <code><a href='plot_regression_predictions.html'>plot_regression_predictions</a></code> or
+  <code><a href='plot_classification_predictions.html'>plot_classification_predictions</a></code>.</p>
     
 
     <h2 class="hasAnchor" id="examples"><a class="anchor" href="#examples"></a>Examples</h2>
-    <pre class="examples"><div class='input'><span class='no'>models</span> <span class='kw'>&lt;-</span> <span class='fu'><a href='machine_learn.html'>machine_learn</a></span>(<span class='no'>pima_diabetes</span>[<span class='fl'>1</span>:<span class='fl'>50</span>, ], <span class='no'>patient_id</span>, <span class='kw'>outcome</span> <span class='kw'>=</span> <span class='no'>plasma_glucose</span>)</div><div class='output co'>#&gt; <span class='message'>Training new data prep recipe</span></div><div class='output co'>#&gt; <span class='message'>Variable(s) ignored in prep_data won't be used to tune models: patient_id</span></div><div class='output co'>#&gt; <span class='message'>plasma_glucose looks numeric, so training regression algorithms.</span></div><div class='output co'>#&gt; <span class='message'>Running cross validation for Random Forest</span></div><div class='output co'>#&gt; <span class='message'>Running cross validation for k-Nearest Neighbors</span></div><div class='input'><span class='no'>predictions</span> <span class='kw'>&lt;-</span> <span class='fu'>predict</span>(<span class='no'>models</span>)
+    <pre class="examples"><div class='input'><span class='no'>models</span> <span class='kw'>&lt;-</span> <span class='fu'><a href='machine_learn.html'>machine_learn</a></span>(<span class='no'>pima_diabetes</span>[<span class='fl'>1</span>:<span class='fl'>50</span>, ], <span class='no'>patient_id</span>, <span class='kw'>outcome</span> <span class='kw'>=</span> <span class='no'>plasma_glucose</span>,
+                        <span class='kw'>models</span> <span class='kw'>=</span> <span class='st'>"rf"</span>, <span class='kw'>tune</span> <span class='kw'>=</span> <span class='fl'>FALSE</span>)</div><div class='output co'>#&gt; <span class='message'>Training new data prep recipe</span></div><div class='output co'>#&gt; <span class='message'>Variable(s) ignored in prep_data won't be used to tune models: patient_id</span></div><div class='output co'>#&gt; <span class='message'>plasma_glucose looks numeric, so training regression algorithms.</span></div><div class='input'><span class='no'>predictions</span> <span class='kw'>&lt;-</span> <span class='fu'>predict</span>(<span class='no'>models</span>)
 <span class='fu'>plot</span>(<span class='no'>predictions</span>)</div><div class='img'><img src='plot.hcai_predicted_df-1.png' alt='' width='576' height='288' /></div><div class='input'><span class='fu'>plot</span>(<span class='no'>predictions</span>, <span class='kw'>title</span> <span class='kw'>=</span> <span class='st'>"This model's predictions regress to the mean"</span>,
      <span class='kw'>point_size</span> <span class='kw'>=</span> <span class='fl'>3</span>, <span class='kw'>point_alpha</span> <span class='kw'>=</span> <span class='fl'>.7</span>, <span class='kw'>font_size</span> <span class='kw'>=</span> <span class='fl'>14</span>)</div><div class='img'><img src='plot.hcai_predicted_df-2.png' alt='' width='576' height='288' /></div></pre>
   </div>
diff --git a/docs/dev/reference/plot.model_list-1.png b/docs/dev/reference/plot.model_list-1.png
index 15c58a046..d6e2f978b 100644
Binary files a/docs/dev/reference/plot.model_list-1.png and b/docs/dev/reference/plot.model_list-1.png differ
diff --git a/docs/dev/reference/plot.model_list-2.png b/docs/dev/reference/plot.model_list-2.png
index a35555819..4663bedb9 100644
Binary files a/docs/dev/reference/plot.model_list-2.png and b/docs/dev/reference/plot.model_list-2.png differ
diff --git a/docs/dev/reference/plot.model_list.html b/docs/dev/reference/plot.model_list.html
index a522f2063..92bfa9359 100644
--- a/docs/dev/reference/plot.model_list.html
+++ b/docs/dev/reference/plot.model_list.html
@@ -159,7 +159,7 @@ <h2 class="hasAnchor" id="value"><a class="anchor" href="#value"></a>Value</h2>
     
 
     <h2 class="hasAnchor" id="examples"><a class="anchor" href="#examples"></a>Examples</h2>
-    <pre class="examples"><div class='input'><span class='no'>models</span> <span class='kw'>&lt;-</span> <span class='fu'><a href='tune_models.html'>tune_models</a></span>(<span class='no'>mtcars</span>, <span class='no'>mpg</span>)</div><div class='output co'>#&gt; <span class='message'>mpg looks numeric, so training regression algorithms.</span></div><div class='output co'>#&gt; <span class='message'>Running cross validation for Random Forest</span></div><div class='output co'>#&gt; <span class='message'>Running cross validation for k-Nearest Neighbors</span></div><div class='input'><span class='fu'>plot</span>(<span class='no'>models</span>)</div><div class='img'><img src='plot.model_list-1.png' alt='' width='576' height='288' /></div><div class='input'><span class='fu'>plot</span>(<span class='fu'><a href='as.model_list.html'>as.model_list</a></span>(<span class='no'>models</span>$<span class='no'>`Random Forest`</span>))</div><div class='img'><img src='plot.model_list-2.png' alt='' width='576' height='288' /></div></pre>
+    <pre class="examples"><div class='input'><span class='no'>models</span> <span class='kw'>&lt;-</span> <span class='fu'><a href='tune_models.html'>tune_models</a></span>(<span class='no'>mtcars</span>, <span class='no'>mpg</span>, <span class='kw'>models</span> <span class='kw'>=</span> <span class='st'>"knn"</span>, <span class='kw'>tune_depth</span> <span class='kw'>=</span> <span class='fl'>5</span>)</div><div class='output co'>#&gt; <span class='message'>mpg looks numeric, so training regression algorithms.</span></div><div class='output co'>#&gt; <span class='message'>Running cross validation for k-Nearest Neighbors</span></div><div class='input'><span class='fu'>plot</span>(<span class='no'>models</span>)</div><div class='img'><img src='plot.model_list-1.png' alt='' width='576' height='288' /></div></pre>
   </div>
   <div class="col-md-3 hidden-xs hidden-sm" id="sidebar">
     <h2>Contents</h2>
diff --git a/docs/dev/reference/predict.model_list-1.png b/docs/dev/reference/predict.model_list-1.png
index e23beb489..ffd1d3a31 100644
Binary files a/docs/dev/reference/predict.model_list-1.png and b/docs/dev/reference/predict.model_list-1.png differ
diff --git a/docs/dev/reference/predict.model_list.html b/docs/dev/reference/predict.model_list.html
index d402b4933..e8834bd5f 100644
--- a/docs/dev/reference/predict.model_list.html
+++ b/docs/dev/reference/predict.model_list.html
@@ -185,34 +185,22 @@ <h2 class="hasAnchor" id="see-also"><a class="anchor" href="#see-also"></a>See a
     
 
     <h2 class="hasAnchor" id="examples"><a class="anchor" href="#examples"></a>Examples</h2>
-    <pre class="examples"><div class='input'><span class='co'># Tune models using only the first 50 rows to keep computation fast</span>
-<span class='no'>models</span> <span class='kw'>&lt;-</span> <span class='fu'><a href='machine_learn.html'>machine_learn</a></span>(<span class='no'>pima_diabetes</span>[<span class='fl'>1</span>:<span class='fl'>50</span>, ], <span class='kw'>outcome</span> <span class='kw'>=</span> <span class='no'>diabetes</span>)</div><div class='output co'>#&gt; <span class='message'>Training new data prep recipe</span></div><div class='output co'>#&gt; <span class='message'>diabetes looks categorical, so training classification algorithms.</span></div><div class='output co'>#&gt; <span class='message'>Running cross validation for Random Forest</span></div><div class='output co'>#&gt; <span class='message'>Running cross validation for k-Nearest Neighbors</span></div><div class='input'><span class='co'># Make prediction on the next 20 rows. This uses the best-performing model from</span>
+    <pre class="examples"><div class='input'><span class='co'># Tune models using only the first 20 rows to keep computation fast</span>
+
+<span class='no'>models</span> <span class='kw'>&lt;-</span> <span class='fu'><a href='machine_learn.html'>machine_learn</a></span>(<span class='no'>pima_diabetes</span>[<span class='fl'>1</span>:<span class='fl'>20</span>, ], <span class='no'>patient_id</span>, <span class='kw'>outcome</span> <span class='kw'>=</span> <span class='no'>diabetes</span>)</div><div class='output co'>#&gt; <span class='message'>Training new data prep recipe</span></div><div class='output co'>#&gt; <span class='message'>Variable(s) ignored in prep_data won't be used to tune models: patient_id</span></div><div class='output co'>#&gt; <span class='message'>diabetes looks categorical, so training classification algorithms.</span></div><div class='output co'>#&gt; <span class='message'>Running cross validation for Random Forest</span></div><div class='output co'>#&gt; <span class='message'>Running cross validation for k-Nearest Neighbors</span></div><div class='input'>
+<span class='co'># Make prediction on the next 5 rows. This uses the best-performing model from</span>
 <span class='co'># tuning cross validation, and it also prepares the new data in the same way as</span>
 <span class='co'># the training data was prepared.</span>
-<span class='no'>predictions</span> <span class='kw'>&lt;-</span> <span class='fu'>predict</span>(<span class='no'>models</span>, <span class='kw'>newdata</span> <span class='kw'>=</span> <span class='no'>pima_diabetes</span>[<span class='fl'>51</span>:<span class='fl'>70</span>, ])</div><div class='output co'>#&gt; <span class='message'>Prepping data based on provided recipe</span></div><div class='input'><span class='no'>predictions</span></div><div class='output co'>#&gt; <span class='message'>"predicted_diabetes" predicted by Random Forest last trained: 2018-04-02 10:59:38</span>
-#&gt; <span class='message'>Performance in training: ROC = 0.73</span></div><div class='output co'>#&gt; # A tibble: 20 x 11
-#&gt;    diabetes predicted_diabe… patient_id pregnancies plasma_glucose diastolic_bp
-#&gt;  * &lt;chr&gt;               &lt;dbl&gt;      &lt;int&gt;       &lt;int&gt;          &lt;int&gt;        &lt;int&gt;
-#&gt;  1 N                   0.131         51           1            103           80
-#&gt;  2 N                   0.160         52           1            101           50
-#&gt;  3 N                   0.114         53           5             88           66
-#&gt;  4 Y                   0.743         54           8            176           90
-#&gt;  5 N                   0.816         55           7            150           66
-#&gt;  6 N                   0.108         56           1             73           50
-#&gt;  7 Y                   0.814         57           7            187           68
-#&gt;  8 N                   0.638         58           0            100           88
-#&gt;  9 N                   0.360         59           0            146           82
-#&gt; 10 N                   0.540         60           0            105           64
-#&gt; 11 N                   0.114         61           2             84           NA
-#&gt; 12 Y                   0.334         62           8            133           72
-#&gt; 13 N                   0.170         63           5             44           62
-#&gt; 14 N                   0.439         64           2            141           58
-#&gt; 15 Y                   0.366         65           7            114           66
-#&gt; 16 N                   0.139         66           5             99           74
-#&gt; 17 Y                   0.316         67           0            109           88
-#&gt; 18 N                   0.274         68           2            109           92
-#&gt; 19 N                   0.113         69           1             95           66
-#&gt; 20 N                   0.137         70           4            146           85
+
+<span class='no'>predictions</span> <span class='kw'>&lt;-</span> <span class='fu'>predict</span>(<span class='no'>models</span>, <span class='kw'>newdata</span> <span class='kw'>=</span> <span class='no'>pima_diabetes</span>[<span class='fl'>21</span>:<span class='fl'>25</span>, ])</div><div class='output co'>#&gt; <span class='message'>Prepping data based on provided recipe</span></div><div class='input'><span class='no'>predictions</span></div><div class='output co'>#&gt; <span class='message'>"predicted_diabetes" predicted by Random Forest last trained: 2018-04-02 18:36:45</span>
+#&gt; <span class='message'>Performance in training: ROC = 0.8</span></div><div class='output co'>#&gt; # A tibble: 5 x 11
+#&gt;   diabetes predicted_diabet… patient_id pregnancies plasma_glucose diastolic_bp
+#&gt; * &lt;chr&gt;                &lt;dbl&gt;      &lt;int&gt;       &lt;int&gt;          &lt;int&gt;        &lt;int&gt;
+#&gt; 1 N                    0.727         21           3            126           88
+#&gt; 2 N                    0.781         22           8             99           84
+#&gt; 3 Y                    0.932         23           7            196           90
+#&gt; 4 Y                    0.522         24           9            119           80
+#&gt; 5 Y                    0.769         25          11            143           94
 #&gt; # ... with 5 more variables: skinfold &lt;int&gt;, insulin &lt;int&gt;, weight_class &lt;chr&gt;,
 #&gt; #   pedigree &lt;dbl&gt;, age &lt;int&gt;</div><div class='input'><span class='fu'>plot</span>(<span class='no'>predictions</span>)</div><div class='img'><img src='predict.model_list-1.png' alt='' width='576' height='288' /></div></pre>
   </div>
diff --git a/docs/dev/reference/prep_data.html b/docs/dev/reference/prep_data.html
index de683f24e..0cb7b19fd 100644
--- a/docs/dev/reference/prep_data.html
+++ b/docs/dev/reference/prep_data.html
@@ -354,16 +354,16 @@ <h2 class="hasAnchor" id="examples"><a class="anchor" href="#examples"></a>Examp
 #&gt; Adding levels to: other, hcai_missing [trained]</div><div class='output co'>#&gt; <span class='message'>Current data:</span></div><div class='output co'>#&gt; # A tibble: 700 x 10
 #&gt;    patient_id pregnancies plasma_glucose diastolic_bp skinfold insulin
 #&gt;         &lt;int&gt;       &lt;dbl&gt;          &lt;dbl&gt;        &lt;dbl&gt;    &lt;dbl&gt;   &lt;dbl&gt;
-#&gt;  1          1       0.646          0.871      -0.0211   0.635   0.344 
-#&gt;  2          2      -0.840         -1.19       -0.514    0.0152 -0.855 
-#&gt;  3          3       1.24           2.02       -0.678   -0.956   0.546 
-#&gt;  4          4      -0.840         -1.06       -0.514   -0.605  -0.613 
-#&gt;  5          5      -1.14           0.511      -2.65     0.635   0.132 
-#&gt;  6          6       0.349         -0.175       0.143   -0.525  -0.252 
-#&gt;  7          7      -0.246         -1.42       -1.83     0.325  -0.673 
-#&gt;  8          8       1.83          -0.208      -0.0957   0.507  -0.0956
-#&gt;  9          9      -0.543          2.47       -0.185    1.67    3.90  
-#&gt; 10         10       1.24           0.119       1.95     0.477   0.837 
+#&gt;  1          1       0.646          0.872      -0.0197   0.636    0.659
+#&gt;  2          2      -0.840         -1.19       -0.513    0.0132  -0.853
+#&gt;  3          3       1.24           2.02       -0.677   -0.889    0.724
+#&gt;  4          4      -0.840         -1.06       -0.513   -0.609   -0.608
+#&gt;  5          5      -1.14           0.512      -2.65     0.636    0.144
+#&gt;  6          6       0.349         -0.175       0.145   -0.377   -0.275
+#&gt;  7          7      -0.246         -1.42       -1.83     0.324   -0.669
+#&gt;  8          8       1.83          -0.208       0.114    0.532   -0.260
+#&gt;  9          9      -0.543          2.47       -0.184    1.67     3.95 
+#&gt; 10         10       1.24           0.119       1.95     0.347    0.581
 #&gt; # ... with 690 more rows, and 4 more variables: weight_class &lt;fct&gt;,
 #&gt; #   pedigree &lt;dbl&gt;, age &lt;dbl&gt;, diabetes &lt;fct&gt;</div></pre>
   </div>
diff --git a/docs/dev/reference/split_train_test.html b/docs/dev/reference/split_train_test.html
index 63b552d0e..3df7d9d17 100644
--- a/docs/dev/reference/split_train_test.html
+++ b/docs/dev/reference/split_train_test.html
@@ -129,7 +129,7 @@ <h1>Split data into training and test data frames</h1>
     <p>Split data into training and test data frames</p>
     
 
-    <pre class="usage"><span class='fu'>split_train_test</span>(<span class='no'>d</span>, <span class='no'>outcome</span>, <span class='kw'>p</span> <span class='kw'>=</span> <span class='fl'>0.8</span>, <span class='no'>seed</span>)</pre>
+    <pre class="usage"><span class='fu'>split_train_test</span>(<span class='no'>d</span>, <span class='no'>outcome</span>, <span class='kw'>percent_train</span> <span class='kw'>=</span> <span class='fl'>0.8</span>, <span class='no'>seed</span>)</pre>
     
     <h2 class="hasAnchor" id="arguments"><a class="anchor" href="#arguments"></a>Arguments</h2>
     <table class="ref-arguments">
@@ -144,7 +144,7 @@ <h2 class="hasAnchor" id="arguments"><a class="anchor" href="#arguments"></a>Arg
 variable</p></td>
     </tr>
     <tr>
-      <th>p</th>
+      <th>percent_train</th>
       <td><p>Proportion of rows in d to put into training. Default is 0.8</p></td>
     </tr>
     <tr>
@@ -166,11 +166,11 @@ <h2 class="hasAnchor" id="details"><a class="anchor" href="#details"></a>Details
     <h2 class="hasAnchor" id="examples"><a class="anchor" href="#examples"></a>Examples</h2>
     <pre class="examples"><div class='input'><span class='fu'>split_train_test</span>(<span class='no'>mtcars</span>, <span class='no'>am</span>, <span class='fl'>.9</span>)</div><div class='output co'>#&gt; $train
 #&gt;                      mpg cyl  disp  hp drat    wt  qsec vs am gear carb
+#&gt; Mazda RX4           21.0   6 160.0 110 3.90 2.620 16.46  0  1    4    4
 #&gt; Mazda RX4 Wag       21.0   6 160.0 110 3.90 2.875 17.02  0  1    4    4
 #&gt; Datsun 710          22.8   4 108.0  93 3.85 2.320 18.61  1  1    4    1
 #&gt; Hornet 4 Drive      21.4   6 258.0 110 3.08 3.215 19.44  1  0    3    1
 #&gt; Hornet Sportabout   18.7   8 360.0 175 3.15 3.440 17.02  0  0    3    2
-#&gt; Valiant             18.1   6 225.0 105 2.76 3.460 20.22  1  0    3    1
 #&gt; Duster 360          14.3   8 360.0 245 3.21 3.570 15.84  0  0    3    4
 #&gt; Merc 240D           24.4   4 146.7  62 3.69 3.190 20.00  1  0    4    2
 #&gt; Merc 230            22.8   4 140.8  95 3.92 3.150 22.90  1  0    4    2
@@ -178,10 +178,8 @@ <h2 class="hasAnchor" id="examples"><a class="anchor" href="#examples"></a>Examp
 #&gt; Merc 280C           17.8   6 167.6 123 3.92 3.440 18.90  1  0    4    4
 #&gt; Merc 450SE          16.4   8 275.8 180 3.07 4.070 17.40  0  0    3    3
 #&gt; Merc 450SL          17.3   8 275.8 180 3.07 3.730 17.60  0  0    3    3
-#&gt; Merc 450SLC         15.2   8 275.8 180 3.07 3.780 18.00  0  0    3    3
 #&gt; Cadillac Fleetwood  10.4   8 472.0 205 2.93 5.250 17.98  0  0    3    4
 #&gt; Lincoln Continental 10.4   8 460.0 215 3.00 5.424 17.82  0  0    3    4
-#&gt; Chrysler Imperial   14.7   8 440.0 230 3.23 5.345 17.42  0  0    3    4
 #&gt; Fiat 128            32.4   4  78.7  66 4.08 2.200 19.47  1  1    4    1
 #&gt; Honda Civic         30.4   4  75.7  52 4.93 1.615 18.52  1  1    4    2
 #&gt; Toyota Corolla      33.9   4  71.1  65 4.22 1.835 19.90  1  1    4    1
@@ -189,7 +187,9 @@ <h2 class="hasAnchor" id="examples"><a class="anchor" href="#examples"></a>Examp
 #&gt; Dodge Challenger    15.5   8 318.0 150 2.76 3.520 16.87  0  0    3    2
 #&gt; AMC Javelin         15.2   8 304.0 150 3.15 3.435 17.30  0  0    3    2
 #&gt; Camaro Z28          13.3   8 350.0 245 3.73 3.840 15.41  0  0    3    4
+#&gt; Pontiac Firebird    19.2   8 400.0 175 3.08 3.845 17.05  0  0    3    2
 #&gt; Fiat X1-9           27.3   4  79.0  66 4.08 1.935 18.90  1  1    4    1
+#&gt; Porsche 914-2       26.0   4 120.3  91 4.43 2.140 16.70  0  1    5    2
 #&gt; Lotus Europa        30.4   4  95.1 113 3.77 1.513 16.90  1  1    5    2
 #&gt; Ford Pantera L      15.8   8 351.0 264 4.22 3.170 14.50  0  1    5    4
 #&gt; Ferrari Dino        19.7   6 145.0 175 3.62 2.770 15.50  0  1    5    6
@@ -197,10 +197,10 @@ <h2 class="hasAnchor" id="examples"><a class="anchor" href="#examples"></a>Examp
 #&gt; Volvo 142E          21.4   4 121.0 109 4.11 2.780 18.60  1  1    4    2
 #&gt; 
 #&gt; $test
-#&gt;                   mpg cyl  disp  hp drat    wt  qsec vs am gear carb
-#&gt; Mazda RX4        21.0   6 160.0 110 3.90 2.620 16.46  0  1    4    4
-#&gt; Pontiac Firebird 19.2   8 400.0 175 3.08 3.845 17.05  0  0    3    2
-#&gt; Porsche 914-2    26.0   4 120.3  91 4.43 2.140 16.70  0  1    5    2
+#&gt;                    mpg cyl  disp  hp drat    wt  qsec vs am gear carb
+#&gt; Valiant           18.1   6 225.0 105 2.76 3.460 20.22  1  0    3    1
+#&gt; Merc 450SLC       15.2   8 275.8 180 3.07 3.780 18.00  0  0    3    3
+#&gt; Chrysler Imperial 14.7   8 440.0 230 3.23 5.345 17.42  0  0    3    4
 #&gt; </div></pre>
   </div>
   <div class="col-md-3 hidden-xs hidden-sm" id="sidebar">
diff --git a/man/figures/README-plot_predictions-1.png b/man/figures/README-plot_predictions-1.png
new file mode 100644
index 000000000..5816c4544
Binary files /dev/null and b/man/figures/README-plot_predictions-1.png differ
diff --git a/man/flash_models.Rd b/man/flash_models.Rd
index ccfb407e3..c15bff959 100644
--- a/man/flash_models.Rd
+++ b/man/flash_models.Rd
@@ -44,12 +44,12 @@ Train models without tuning for performance
 }
 \details{
 This function has two major differences from
-  \code{\link{tune_models}}: \enumerate{\item{It uses default hyperparameter
-  values to train models instead of using cross-validation to optimize
-  hyperparameter values for predictive performance.} \item{It is much
-  faster.}}
+  \code{\link{tune_models}}: 1. It uses fixed hyperparameter values to train
+  models instead of using cross-validation to optimize hyperparameter values
+  for predictive performance, and, as a result, 2. It is much faster.
 }
 \examples{
+\dontrun{
 # Prepare data
 prepped_data <- prep_data(pima_diabetes, patient_id, outcome = diabetes)
 
@@ -76,15 +76,14 @@ models <-
 summary(models)
 
 # Speed comparison of no tuning with flash_models vs. tuning with tune_models:
-\dontrun{
-  # ~40 seconds:
-  system.time(
-    tune_models(prepped_data, diabetes)
-  )
-  # ~6 seconds:
-  system.time(
-    flash_models(prepped_data, diabetes)
-  )
+# ~40 seconds:
+system.time(
+  tune_models(prepped_data, diabetes)
+)
+# ~6 seconds:
+system.time(
+  flash_models(prepped_data, diabetes)
+)
 }
 }
 \seealso{
diff --git a/man/machine_learn.Rd b/man/machine_learn.Rd
index f059cde77..8f3800b2e 100644
--- a/man/machine_learn.Rd
+++ b/man/machine_learn.Rd
@@ -47,29 +47,35 @@ This is a high-level wrapper function. For finer control of data
   wraps. For finer control of model tuning use \code{\link{tune_models}}.
 }
 \examples{
-# Split data into training and test sets using a subset of the data for speed
-training_data <- pima_diabetes[1:50, ]
-test_data <- pima_diabetes[51:60, ]
+# Split the data into training and test sets, using just 100 rows for speed
+d <- split_train_test(d = pima_diabetes[1:100, ],
+                      outcome = diabetes,
+                      percent_train = .9)
 
 ### Classification ###
 
-# Clean and prep the data, tune algorithms over hyperparameter values to predict diabetes
-diabetes_models <- machine_learn(training_data, outcome = diabetes)
+# Clean and prep the training data, specifying that patient_id is an ID column,
+# and tune algorithms over hyperparameter values to predict diabetes
+diabetes_models <- machine_learn(d$train, patient_id, outcome = diabetes)
+
+# Inspect model specification and performance
+diabetes_models
 
 # Make predictions (predicted probability of diabetes) on test data
-predict(diabetes_models, test_data)
+predict(diabetes_models, d$test)
 
 ### Regression ###
 
-# Predict numeric outcomes simply by specifying the name of the outcome variable
-age_model <- machine_learn(training_data, outcome = age)
+# If the outcome variable is numeric, regression models will be trained
+age_model <- machine_learn(d$train, patient_id, outcome = age)
 
-# If new data isn't specifed, get predictions on training data. Plot predictions
+# If new data isn't specifed, get predictions on training data
 predict(age_model)
 
 ### Faster model training without tuning hyperparameters ###
 
-# Train models at set hyperparameter values by setting tune to FALSE.
-# This is faster (especially on larger datasets), but produces models with less predictive accuracy.
-machine_learn(training_data, outcome = diabetes, tune = FALSE)
+# Train models at set hyperparameter values by setting tune to FALSE. This is
+# faster (especially on larger datasets), but produces models with less
+# predictive accuracy.
+machine_learn(d$train, patient_id, outcome = diabetes, tune = FALSE)
 }
diff --git a/man/plot.hcai_predicted_df.Rd b/man/plot.hcai_predicted_df.Rd
index 4daf0be72..55b1d220b 100644
--- a/man/plot.hcai_predicted_df.Rd
+++ b/man/plot.hcai_predicted_df.Rd
@@ -25,13 +25,14 @@ Plot model predictions vs observed outcomes
 }
 \details{
 The following arguments can be provided to customize the plot: For
-  regression: title, point_size, point_alpha, font_size. For
-  classification: title, fill_colors, fill_alpha, curve_flex, font_size. For
-  details on how to use them, see \code{\link{plot_regression_predictions}}
-  or \code{\link{plot_classification_predictions}}.
+  regression: title, point_size, point_alpha, font_size. For classification:
+  title, fill_colors, fill_alpha, curve_flex, font_size. For details on how
+  to use them, see \code{\link{plot_regression_predictions}} or
+  \code{\link{plot_classification_predictions}}.
 }
 \examples{
-models <- machine_learn(pima_diabetes[1:50, ], patient_id, outcome = plasma_glucose)
+models <- machine_learn(pima_diabetes[1:50, ], patient_id, outcome = plasma_glucose,
+                        models = "rf", tune = FALSE)
 predictions <- predict(models)
 plot(predictions)
 plot(predictions, title = "This model's predictions regress to the mean",
diff --git a/man/plot.model_list.Rd b/man/plot.model_list.Rd
index 1df5a42c2..52b165aa5 100644
--- a/man/plot.model_list.Rd
+++ b/man/plot.model_list.Rd
@@ -24,7 +24,6 @@ Plot of model performance as a function of algorithm and
 Plot performance of models
 }
 \examples{
-models <- tune_models(mtcars, mpg)
+models <- tune_models(mtcars, mpg, models = "knn", tune_depth = 5)
 plot(models)
-plot(as.model_list(models$`Random Forest`))
 }
diff --git a/man/predict.model_list.Rd b/man/predict.model_list.Rd
index 30e1e12a6..fa89df512 100644
--- a/man/predict.model_list.Rd
+++ b/man/predict.model_list.Rd
@@ -42,12 +42,15 @@ The model and hyperparameter values with the best out-of-fold
   returning your predictions with the newdata in its original format.
 }
 \examples{
-# Tune models using only the first 50 rows to keep computation fast
-models <- machine_learn(pima_diabetes[1:50, ], outcome = diabetes)
-# Make prediction on the next 20 rows. This uses the best-performing model from
+# Tune models using only the first 20 rows to keep computation fast
+
+models <- machine_learn(pima_diabetes[1:20, ], patient_id, outcome = diabetes)
+
+# Make prediction on the next 5 rows. This uses the best-performing model from
 # tuning cross validation, and it also prepares the new data in the same way as
 # the training data was prepared.
-predictions <- predict(models, newdata = pima_diabetes[51:70, ])
+
+predictions <- predict(models, newdata = pima_diabetes[21:25, ])
 predictions
 plot(predictions)
 }
diff --git a/man/split_train_test.Rd b/man/split_train_test.Rd
index 1fa60ff67..444fafda6 100644
--- a/man/split_train_test.Rd
+++ b/man/split_train_test.Rd
@@ -4,7 +4,7 @@
 \alias{split_train_test}
 \title{Split data into training and test data frames}
 \usage{
-split_train_test(d, outcome, p = 0.8, seed)
+split_train_test(d, outcome, percent_train = 0.8, seed)
 }
 \arguments{
 \item{d}{Data frame}
@@ -12,7 +12,7 @@ split_train_test(d, outcome, p = 0.8, seed)
 \item{outcome}{Target column, unquoted. Split will be stratified across this
 variable}
 
-\item{p}{Proportion of rows in d to put into training. Default is 0.8}
+\item{percent_train}{Proportion of rows in d to put into training. Default is 0.8}
 
 \item{seed}{Optional, if provided the function will return the same split
 each time it is called}
diff --git a/readme_files/figure-gfm/unnamed-chunk-3-1.png b/readme_files/figure-gfm/unnamed-chunk-3-1.png
deleted file mode 100644
index c4bd65b2d..000000000
Binary files a/readme_files/figure-gfm/unnamed-chunk-3-1.png and /dev/null differ
diff --git a/vignettes/healthcareai.R b/vignettes/healthcareai.R
index c4030f0d1..44da95f60 100644
--- a/vignettes/healthcareai.R
+++ b/vignettes/healthcareai.R
@@ -1,7 +1,7 @@
 ## ----setup, include=FALSE------------------------------------------------
 set.seed(43170)
 knitr::opts_chunk$set(echo = TRUE, results = "hold", collapse = TRUE, 
-                      comment = "#> ")
+                      comment = "# >")
 options(tibble.print_min = 5, tibble.print_max = 5)
 
 ## ------------------------------------------------------------------------
diff --git a/vignettes/healthcareai.Rmd b/vignettes/healthcareai.Rmd
index 802c814f4..3af5e6065 100644
--- a/vignettes/healthcareai.Rmd
+++ b/vignettes/healthcareai.Rmd
@@ -4,13 +4,13 @@ output: rmarkdown::html_vignette
 vignette: >
   %\VignetteIndexEntry{Getting Started with healthcareai}
   %\VignetteEngine{knitr::rmarkdown}
-  %\VignetteEncoding{UTF-8}
+  \usepackage[utf8]{inputenc}
 ---
 
 ```{r setup, include=FALSE}
 set.seed(43170)
 knitr::opts_chunk$set(echo = TRUE, results = "hold", collapse = TRUE, 
-                      comment = "#> ")
+                      comment = "# >")
 options(tibble.print_min = 5, tibble.print_max = 5)
 ```
 
diff --git a/vignettes/healthcareai.html b/vignettes/healthcareai.html
index 982c6e0ef..c630af8b4 100644
--- a/vignettes/healthcareai.html
+++ b/vignettes/healthcareai.html
@@ -284,62 +284,62 @@ <h1 class="title toc-ignore">Getting Started with healthcareai</h1>
 <div class="sourceCode" id="cb1"><pre class="sourceCode r"><code class="sourceCode r"><a class="sourceLine" id="cb1-1" data-line-number="1"><span class="kw">library</span>(healthcareai)</a></code></pre></div>
 <p><code>healthcareai</code> comes with a built in dataset documenting diabetes among adult Pima females. Once you attach the package, the dataset is available in the variable <code>pima_diabetes</code>. Let’s take a look at the data with the <code>str</code> function. There are 768 records in 10 variables including one identifier column, several nominal variables, and substantial missingness (represented in R by <code>NA</code>).</p>
 <div class="sourceCode" id="cb2"><pre class="sourceCode r"><code class="sourceCode r"><a class="sourceLine" id="cb2-1" data-line-number="1"><span class="kw">str</span>(pima_diabetes)</a>
-<a class="sourceLine" id="cb2-2" data-line-number="2"><span class="co">#&gt;  Classes 'tbl_df', 'tbl' and 'data.frame':   768 obs. of  10 variables:</span></a>
-<a class="sourceLine" id="cb2-3" data-line-number="3"><span class="co">#&gt;   $ patient_id    : int  1 2 3 4 5 6 7 8 9 10 ...</span></a>
-<a class="sourceLine" id="cb2-4" data-line-number="4"><span class="co">#&gt;   $ pregnancies   : int  6 1 8 1 0 5 3 10 2 8 ...</span></a>
-<a class="sourceLine" id="cb2-5" data-line-number="5"><span class="co">#&gt;   $ plasma_glucose: int  148 85 183 89 137 116 78 115 197 125 ...</span></a>
-<a class="sourceLine" id="cb2-6" data-line-number="6"><span class="co">#&gt;   $ diastolic_bp  : int  72 66 64 66 40 74 50 NA 70 96 ...</span></a>
-<a class="sourceLine" id="cb2-7" data-line-number="7"><span class="co">#&gt;   $ skinfold      : int  35 29 NA 23 35 NA 32 NA 45 NA ...</span></a>
-<a class="sourceLine" id="cb2-8" data-line-number="8"><span class="co">#&gt;   $ insulin       : int  NA NA NA 94 168 NA 88 NA 543 NA ...</span></a>
-<a class="sourceLine" id="cb2-9" data-line-number="9"><span class="co">#&gt;   $ weight_class  : chr  &quot;obese&quot; &quot;overweight&quot; &quot;normal&quot; &quot;overweight&quot; ...</span></a>
-<a class="sourceLine" id="cb2-10" data-line-number="10"><span class="co">#&gt;   $ pedigree      : num  0.627 0.351 0.672 0.167 2.288 ...</span></a>
-<a class="sourceLine" id="cb2-11" data-line-number="11"><span class="co">#&gt;   $ age           : int  50 31 32 21 33 30 26 29 53 54 ...</span></a>
-<a class="sourceLine" id="cb2-12" data-line-number="12"><span class="co">#&gt;   $ diabetes      : chr  &quot;Y&quot; &quot;N&quot; &quot;Y&quot; &quot;N&quot; ...</span></a></code></pre></div>
+<a class="sourceLine" id="cb2-2" data-line-number="2"><span class="co"># &gt; Classes 'tbl_df', 'tbl' and 'data.frame':   768 obs. of  10 variables:</span></a>
+<a class="sourceLine" id="cb2-3" data-line-number="3"><span class="co"># &gt;  $ patient_id    : int  1 2 3 4 5 6 7 8 9 10 ...</span></a>
+<a class="sourceLine" id="cb2-4" data-line-number="4"><span class="co"># &gt;  $ pregnancies   : int  6 1 8 1 0 5 3 10 2 8 ...</span></a>
+<a class="sourceLine" id="cb2-5" data-line-number="5"><span class="co"># &gt;  $ plasma_glucose: int  148 85 183 89 137 116 78 115 197 125 ...</span></a>
+<a class="sourceLine" id="cb2-6" data-line-number="6"><span class="co"># &gt;  $ diastolic_bp  : int  72 66 64 66 40 74 50 NA 70 96 ...</span></a>
+<a class="sourceLine" id="cb2-7" data-line-number="7"><span class="co"># &gt;  $ skinfold      : int  35 29 NA 23 35 NA 32 NA 45 NA ...</span></a>
+<a class="sourceLine" id="cb2-8" data-line-number="8"><span class="co"># &gt;  $ insulin       : int  NA NA NA 94 168 NA 88 NA 543 NA ...</span></a>
+<a class="sourceLine" id="cb2-9" data-line-number="9"><span class="co"># &gt;  $ weight_class  : chr  &quot;obese&quot; &quot;overweight&quot; &quot;normal&quot; &quot;overweight&quot; ...</span></a>
+<a class="sourceLine" id="cb2-10" data-line-number="10"><span class="co"># &gt;  $ pedigree      : num  0.627 0.351 0.672 0.167 2.288 ...</span></a>
+<a class="sourceLine" id="cb2-11" data-line-number="11"><span class="co"># &gt;  $ age           : int  50 31 32 21 33 30 26 29 53 54 ...</span></a>
+<a class="sourceLine" id="cb2-12" data-line-number="12"><span class="co"># &gt;  $ diabetes      : chr  &quot;Y&quot; &quot;N&quot; &quot;Y&quot; &quot;N&quot; ...</span></a></code></pre></div>
 <div id="easy-machine-learning" class="section level1">
 <h1>Easy Machine Learning</h1>
 <p>If you don’t want to fuss with details any more than necessary, <code>machine_learn</code> is the function for you. It makes it as easy as possible to implement machine learning models by putting all the detais in the background so that you don’t have to worry about them. Of course it might be wise to worry about them, and we’ll get to how to do that further down, but for now, you can automatically take care of problems in the data, do basic feature engineering, and tune multiple machine learning models using cross validation with <code>machine_learn</code>.</p>
 <p><code>machine_learn</code> always gets the name of the data frame, then any columns that should not be used by the model (uninformative columns, such as IDs), then the variable to be predicted with <code>outcome =</code>. If you want <code>machine_learn</code> to run faster, you can have that—at the expense of a bit of predictive power—by setting its <code>tune</code> argument to <code>FALSE</code>.</p>
 <div class="sourceCode" id="cb3"><pre class="sourceCode r"><code class="sourceCode r"><a class="sourceLine" id="cb3-1" data-line-number="1">quick_models &lt;-<span class="st"> </span><span class="kw">machine_learn</span>(pima_diabetes, patient_id, <span class="dt">outcome =</span> diabetes)</a>
-<a class="sourceLine" id="cb3-2" data-line-number="2"><span class="co">#&gt;  Training new data prep recipe</span></a>
-<a class="sourceLine" id="cb3-3" data-line-number="3"><span class="co">#&gt;  Variable(s) ignored in prep_data won't be used to tune models: patient_id</span></a>
-<a class="sourceLine" id="cb3-4" data-line-number="4"><span class="co">#&gt;  diabetes looks categorical, so training classification algorithms.</span></a>
-<a class="sourceLine" id="cb3-5" data-line-number="5"><span class="co">#&gt;  Running cross validation for Random Forest</span></a>
-<a class="sourceLine" id="cb3-6" data-line-number="6"><span class="co">#&gt;  Running cross validation for k-Nearest Neighbors</span></a></code></pre></div>
+<a class="sourceLine" id="cb3-2" data-line-number="2"><span class="co"># &gt; Training new data prep recipe</span></a>
+<a class="sourceLine" id="cb3-3" data-line-number="3"><span class="co"># &gt; Variable(s) ignored in prep_data won't be used to tune models: patient_id</span></a>
+<a class="sourceLine" id="cb3-4" data-line-number="4"><span class="co"># &gt; diabetes looks categorical, so training classification algorithms.</span></a>
+<a class="sourceLine" id="cb3-5" data-line-number="5"><span class="co"># &gt; Running cross validation for Random Forest</span></a>
+<a class="sourceLine" id="cb3-6" data-line-number="6"><span class="co"># &gt; Running cross validation for k-Nearest Neighbors</span></a></code></pre></div>
 <p><code>machine_learn</code> has told us that it has created a recipe for data preparation (this allows us to do exactly the same data cleaning and feature engineering when you want predictions on a new dataset), is ignoring <code>patient_id</code> when tuning models as we told it to, is training classification algorithms because the outcome variable <code>diabetes</code> is categorical, and has executed cross validation for two machine learning models: random forests, and k-nearest neighbors. Let’s see what the models look like.</p>
 <div class="sourceCode" id="cb4"><pre class="sourceCode r"><code class="sourceCode r"><a class="sourceLine" id="cb4-1" data-line-number="1">quick_models</a>
-<a class="sourceLine" id="cb4-2" data-line-number="2"><span class="co">#&gt;  Algorithms Trained: Random Forest, k-Nearest Neighbors</span></a>
-<a class="sourceLine" id="cb4-3" data-line-number="3"><span class="co">#&gt;  Target: diabetes</span></a>
-<a class="sourceLine" id="cb4-4" data-line-number="4"><span class="co">#&gt;  Class: Classification</span></a>
-<a class="sourceLine" id="cb4-5" data-line-number="5"><span class="co">#&gt;  Performance Metric: ROC</span></a>
-<a class="sourceLine" id="cb4-6" data-line-number="6"><span class="co">#&gt;  Number of Observations: 768</span></a>
-<a class="sourceLine" id="cb4-7" data-line-number="7"><span class="co">#&gt;  Number of Features: 12</span></a>
-<a class="sourceLine" id="cb4-8" data-line-number="8"><span class="co">#&gt;  Models Trained: 2018-04-02 05:58:09 </span></a>
-<a class="sourceLine" id="cb4-9" data-line-number="9"><span class="co">#&gt;  </span></a>
-<a class="sourceLine" id="cb4-10" data-line-number="10"><span class="co">#&gt;  Models tuned via 5-fold cross validation over 9 combinations of hyperparameter values.</span></a>
-<a class="sourceLine" id="cb4-11" data-line-number="11"><span class="co">#&gt;  Best model: Random Forest</span></a>
-<a class="sourceLine" id="cb4-12" data-line-number="12"><span class="co">#&gt;  ROC = 0.84</span></a>
-<a class="sourceLine" id="cb4-13" data-line-number="13"><span class="co">#&gt;  Optimal hyperparameter values:</span></a>
-<a class="sourceLine" id="cb4-14" data-line-number="14"><span class="co">#&gt;    mtry = 5</span></a>
-<a class="sourceLine" id="cb4-15" data-line-number="15"><span class="co">#&gt;    splitrule = extratrees</span></a>
-<a class="sourceLine" id="cb4-16" data-line-number="16"><span class="co">#&gt;    min.node.size = 12</span></a></code></pre></div>
+<a class="sourceLine" id="cb4-2" data-line-number="2"><span class="co"># &gt; Algorithms Trained: Random Forest, k-Nearest Neighbors</span></a>
+<a class="sourceLine" id="cb4-3" data-line-number="3"><span class="co"># &gt; Target: diabetes</span></a>
+<a class="sourceLine" id="cb4-4" data-line-number="4"><span class="co"># &gt; Class: Classification</span></a>
+<a class="sourceLine" id="cb4-5" data-line-number="5"><span class="co"># &gt; Performance Metric: ROC</span></a>
+<a class="sourceLine" id="cb4-6" data-line-number="6"><span class="co"># &gt; Number of Observations: 768</span></a>
+<a class="sourceLine" id="cb4-7" data-line-number="7"><span class="co"># &gt; Number of Features: 12</span></a>
+<a class="sourceLine" id="cb4-8" data-line-number="8"><span class="co"># &gt; Models Trained: 2018-04-02 16:18:34 </span></a>
+<a class="sourceLine" id="cb4-9" data-line-number="9"><span class="co"># &gt; </span></a>
+<a class="sourceLine" id="cb4-10" data-line-number="10"><span class="co"># &gt; Models tuned via 5-fold cross validation over 9 combinations of hyperparameter values.</span></a>
+<a class="sourceLine" id="cb4-11" data-line-number="11"><span class="co"># &gt; Best model: Random Forest</span></a>
+<a class="sourceLine" id="cb4-12" data-line-number="12"><span class="co"># &gt; ROC = 0.84</span></a>
+<a class="sourceLine" id="cb4-13" data-line-number="13"><span class="co"># &gt; Optimal hyperparameter values:</span></a>
+<a class="sourceLine" id="cb4-14" data-line-number="14"><span class="co"># &gt;   mtry = 5</span></a>
+<a class="sourceLine" id="cb4-15" data-line-number="15"><span class="co"># &gt;   splitrule = extratrees</span></a>
+<a class="sourceLine" id="cb4-16" data-line-number="16"><span class="co"># &gt;   min.node.size = 12</span></a></code></pre></div>
 <p>Everything looks as expected, and the best model is is a random forest that achives performance of AUROC = 0.84. Not bad for one line of code.</p>
 <p>Now that we have our models, we can make predictions using the <code>predict</code> function. If you provide a new data frame to <code>predict</code> it will make predictions on the new data; otherwise, it will make predictions on the training data.</p>
 <div class="sourceCode" id="cb5"><pre class="sourceCode r"><code class="sourceCode r"><a class="sourceLine" id="cb5-1" data-line-number="1">predictions &lt;-<span class="st"> </span><span class="kw">predict</span>(quick_models)</a>
 <a class="sourceLine" id="cb5-2" data-line-number="2">predictions</a>
-<a class="sourceLine" id="cb5-3" data-line-number="3"><span class="co">#&gt;  &quot;predicted_diabetes&quot; predicted by Random Forest last trained: 2018-04-02 05:58:09</span></a>
-<a class="sourceLine" id="cb5-4" data-line-number="4"><span class="co">#&gt;  Performance in training: ROC = 0.84</span></a>
-<a class="sourceLine" id="cb5-5" data-line-number="5"><span class="co">#&gt;  # A tibble: 768 x 14</span></a>
-<a class="sourceLine" id="cb5-6" data-line-number="6"><span class="co">#&gt;    diabetes predicted_diabetes pregnancies plasma_glucose diastolic_bp</span></a>
-<a class="sourceLine" id="cb5-7" data-line-number="7"><span class="co">#&gt;  * &lt;fct&gt;                 &lt;dbl&gt;       &lt;int&gt;          &lt;dbl&gt;        &lt;dbl&gt;</span></a>
-<a class="sourceLine" id="cb5-8" data-line-number="8"><span class="co">#&gt;  1 Y                   0.796             6           148.          72.</span></a>
-<a class="sourceLine" id="cb5-9" data-line-number="9"><span class="co">#&gt;  2 N                   0.0740            1            85.          66.</span></a>
-<a class="sourceLine" id="cb5-10" data-line-number="10"><span class="co">#&gt;  3 Y                   0.608             8           183.          64.</span></a>
-<a class="sourceLine" id="cb5-11" data-line-number="11"><span class="co">#&gt;  4 N                   0.00639           1            89.          66.</span></a>
-<a class="sourceLine" id="cb5-12" data-line-number="12"><span class="co">#&gt;  5 Y                   0.717             0           137.          40.</span></a>
-<a class="sourceLine" id="cb5-13" data-line-number="13"><span class="co">#&gt;  # ... with 763 more rows, and 9 more variables: skinfold &lt;dbl&gt;,</span></a>
-<a class="sourceLine" id="cb5-14" data-line-number="14"><span class="co">#&gt;  #   insulin &lt;dbl&gt;, pedigree &lt;dbl&gt;, age &lt;int&gt;, weight_class_normal &lt;dbl&gt;,</span></a>
-<a class="sourceLine" id="cb5-15" data-line-number="15"><span class="co">#&gt;  #   weight_class_obese &lt;dbl&gt;, weight_class_overweight &lt;dbl&gt;,</span></a>
-<a class="sourceLine" id="cb5-16" data-line-number="16"><span class="co">#&gt;  #   weight_class_other &lt;dbl&gt;, weight_class_hcai_missing &lt;dbl&gt;</span></a></code></pre></div>
+<a class="sourceLine" id="cb5-3" data-line-number="3"><span class="co"># &gt; &quot;predicted_diabetes&quot; predicted by Random Forest last trained: 2018-04-02 16:18:34</span></a>
+<a class="sourceLine" id="cb5-4" data-line-number="4"><span class="co"># &gt; Performance in training: ROC = 0.84</span></a>
+<a class="sourceLine" id="cb5-5" data-line-number="5"><span class="co"># &gt; # A tibble: 768 x 14</span></a>
+<a class="sourceLine" id="cb5-6" data-line-number="6"><span class="co"># &gt;   diabetes predicted_diabetes pregnancies plasma_glucose diastolic_bp</span></a>
+<a class="sourceLine" id="cb5-7" data-line-number="7"><span class="co"># &gt; * &lt;fct&gt;                 &lt;dbl&gt;       &lt;int&gt;          &lt;dbl&gt;        &lt;dbl&gt;</span></a>
+<a class="sourceLine" id="cb5-8" data-line-number="8"><span class="co"># &gt; 1 Y                   0.796             6           148.          72.</span></a>
+<a class="sourceLine" id="cb5-9" data-line-number="9"><span class="co"># &gt; 2 N                   0.0740            1            85.          66.</span></a>
+<a class="sourceLine" id="cb5-10" data-line-number="10"><span class="co"># &gt; 3 Y                   0.608             8           183.          64.</span></a>
+<a class="sourceLine" id="cb5-11" data-line-number="11"><span class="co"># &gt; 4 N                   0.00639           1            89.          66.</span></a>
+<a class="sourceLine" id="cb5-12" data-line-number="12"><span class="co"># &gt; 5 Y                   0.717             0           137.          40.</span></a>
+<a class="sourceLine" id="cb5-13" data-line-number="13"><span class="co"># &gt; # ... with 763 more rows, and 9 more variables: skinfold &lt;dbl&gt;,</span></a>
+<a class="sourceLine" id="cb5-14" data-line-number="14"><span class="co"># &gt; #   insulin &lt;dbl&gt;, pedigree &lt;dbl&gt;, age &lt;int&gt;, weight_class_normal &lt;dbl&gt;,</span></a>
+<a class="sourceLine" id="cb5-15" data-line-number="15"><span class="co"># &gt; #   weight_class_obese &lt;dbl&gt;, weight_class_overweight &lt;dbl&gt;,</span></a>
+<a class="sourceLine" id="cb5-16" data-line-number="16"><span class="co"># &gt; #   weight_class_other &lt;dbl&gt;, weight_class_hcai_missing &lt;dbl&gt;</span></a></code></pre></div>
 <p>We get a message about when the model was trained and how well it preformed in training, and we get back a data frame that looks sort of like the original, but has a new column <code>predited_diabetes</code> that contains the model-generated probability each individual has diabetes, and contains changes that were made preparing the data for model training, e.g. missingness has been filled in and <code>weight_class</code> has been split into a series of “dummy” variables.</p>
 <p>We can plot how effectively the model is able to separate diabetic from non-diabetic individuals by calling the <code>plot</code> function on the output of <code>predict</code>.</p>
 <div class="sourceCode" id="cb6"><pre class="sourceCode r"><code class="sourceCode r"><a class="sourceLine" id="cb6-1" data-line-number="1"><span class="kw">plot</span>(predictions)</a></code></pre></div>
@@ -349,17 +349,17 @@ <h1>Easy Machine Learning</h1>
 <h1>Data Profiling</h1>
 <p>It is always a good idea to be aware of where there are missing values in data. The <code>missingness</code> function helps with that. In addition to looking for values R sees as missing, it looks for other values that might represent missing, such as <code>&quot;NULL&quot;</code>, and issues a warning if it finds any.</p>
 <div class="sourceCode" id="cb7"><pre class="sourceCode r"><code class="sourceCode r"><a class="sourceLine" id="cb7-1" data-line-number="1"><span class="kw">missingness</span>(pima_diabetes)</a>
-<a class="sourceLine" id="cb7-2" data-line-number="2"><span class="co">#&gt;           variable percent_missing</span></a>
-<a class="sourceLine" id="cb7-3" data-line-number="3"><span class="co">#&gt;  1      patient_id             0.0</span></a>
-<a class="sourceLine" id="cb7-4" data-line-number="4"><span class="co">#&gt;  2     pregnancies             0.0</span></a>
-<a class="sourceLine" id="cb7-5" data-line-number="5"><span class="co">#&gt;  3        pedigree             0.0</span></a>
-<a class="sourceLine" id="cb7-6" data-line-number="6"><span class="co">#&gt;  4             age             0.0</span></a>
-<a class="sourceLine" id="cb7-7" data-line-number="7"><span class="co">#&gt;  5        diabetes             0.0</span></a>
-<a class="sourceLine" id="cb7-8" data-line-number="8"><span class="co">#&gt;  6  plasma_glucose             0.7</span></a>
-<a class="sourceLine" id="cb7-9" data-line-number="9"><span class="co">#&gt;  7    weight_class             1.4</span></a>
-<a class="sourceLine" id="cb7-10" data-line-number="10"><span class="co">#&gt;  8    diastolic_bp             4.6</span></a>
-<a class="sourceLine" id="cb7-11" data-line-number="11"><span class="co">#&gt;  9        skinfold            29.6</span></a>
-<a class="sourceLine" id="cb7-12" data-line-number="12"><span class="co">#&gt;  10        insulin            48.7</span></a></code></pre></div>
+<a class="sourceLine" id="cb7-2" data-line-number="2"><span class="co"># &gt;          variable percent_missing</span></a>
+<a class="sourceLine" id="cb7-3" data-line-number="3"><span class="co"># &gt; 1      patient_id             0.0</span></a>
+<a class="sourceLine" id="cb7-4" data-line-number="4"><span class="co"># &gt; 2     pregnancies             0.0</span></a>
+<a class="sourceLine" id="cb7-5" data-line-number="5"><span class="co"># &gt; 3        pedigree             0.0</span></a>
+<a class="sourceLine" id="cb7-6" data-line-number="6"><span class="co"># &gt; 4             age             0.0</span></a>
+<a class="sourceLine" id="cb7-7" data-line-number="7"><span class="co"># &gt; 5        diabetes             0.0</span></a>
+<a class="sourceLine" id="cb7-8" data-line-number="8"><span class="co"># &gt; 6  plasma_glucose             0.7</span></a>
+<a class="sourceLine" id="cb7-9" data-line-number="9"><span class="co"># &gt; 7    weight_class             1.4</span></a>
+<a class="sourceLine" id="cb7-10" data-line-number="10"><span class="co"># &gt; 8    diastolic_bp             4.6</span></a>
+<a class="sourceLine" id="cb7-11" data-line-number="11"><span class="co"># &gt; 9        skinfold            29.6</span></a>
+<a class="sourceLine" id="cb7-12" data-line-number="12"><span class="co"># &gt; 10        insulin            48.7</span></a></code></pre></div>
 <p>It’s good that we don’t have any missingness in our ID or outcome columns. We’ll see how missingness in predictors is addressed further down.</p>
 </div>
 <div id="data-preparation" class="section level1">
@@ -375,7 +375,7 @@ <h1>Data Preparation</h1>
 <div class="sourceCode" id="cb9"><pre class="sourceCode r"><code class="sourceCode r"><a class="sourceLine" id="cb9-1" data-line-number="1">prepped_training_data &lt;-<span class="st"> </span><span class="kw">prep_data</span>(split_data<span class="op">$</span>train, patient_id, <span class="dt">outcome =</span> diabetes,</a>
 <a class="sourceLine" id="cb9-2" data-line-number="2">                                   <span class="dt">center =</span> <span class="ot">TRUE</span>, <span class="dt">scale =</span> <span class="ot">TRUE</span>,</a>
 <a class="sourceLine" id="cb9-3" data-line-number="3">                                   <span class="dt">collapse_rare_factors =</span> <span class="ot">FALSE</span>)</a>
-<a class="sourceLine" id="cb9-4" data-line-number="4"><span class="co">#&gt;  Training new data prep recipe</span></a></code></pre></div>
+<a class="sourceLine" id="cb9-4" data-line-number="4"><span class="co"># &gt; Training new data prep recipe</span></a></code></pre></div>
 <p>The “recipe” that the above message refers to is a set of instructions for how to transform a dataset the way we just transformed our training data. Any machine learning that we do (within <code>healthcareai</code>) on <code>prepped_training_data</code> will retain that recipe and apply it before making predictions on new data. That means that when you have models making predictions in production, you don’t have to figure out how to transform the data or worry about encountering missing data or new category levels.</p>
 </div>
 <div id="model-training" class="section level1">
@@ -388,10 +388,10 @@ <h1>Model Training</h1>
 <a class="sourceLine" id="cb10-3" data-line-number="3">                      <span class="dt">models =</span> <span class="st">&quot;RF&quot;</span>,</a>
 <a class="sourceLine" id="cb10-4" data-line-number="4">                      <span class="dt">tune_depth =</span> <span class="dv">25</span>,</a>
 <a class="sourceLine" id="cb10-5" data-line-number="5">                      <span class="dt">metric =</span> <span class="st">&quot;PR&quot;</span>)</a>
-<a class="sourceLine" id="cb10-6" data-line-number="6"><span class="co">#&gt;  Variable(s) ignored in prep_data won't be used to tune models: patient_id</span></a>
-<a class="sourceLine" id="cb10-7" data-line-number="7"><span class="co">#&gt;  diabetes looks categorical, so training classification algorithms.</span></a>
-<a class="sourceLine" id="cb10-8" data-line-number="8"><span class="co">#&gt;  You've chosen to tune 125 models (n_folds = 5 x tune_depth = 25 x length(models) = 1) on a 692 row dataset. This may take a while...</span></a>
-<a class="sourceLine" id="cb10-9" data-line-number="9"><span class="co">#&gt;  Running cross validation for Random Forest</span></a></code></pre></div>
+<a class="sourceLine" id="cb10-6" data-line-number="6"><span class="co"># &gt; Variable(s) ignored in prep_data won't be used to tune models: patient_id</span></a>
+<a class="sourceLine" id="cb10-7" data-line-number="7"><span class="co"># &gt; diabetes looks categorical, so training classification algorithms.</span></a>
+<a class="sourceLine" id="cb10-8" data-line-number="8"><span class="co"># &gt; You've chosen to tune 125 models (n_folds = 5 x tune_depth = 25 x length(models) = 1) on a 692 row dataset. This may take a while...</span></a>
+<a class="sourceLine" id="cb10-9" data-line-number="9"><span class="co"># &gt; Running cross validation for Random Forest</span></a></code></pre></div>
 <p>We get a message saying the training may take a while because we’re training so many models, but in this case it takes just about 20 seconds to train all those models.</p>
 <p>We can examine how the model performs across hyperparameters by plotting the model object. It looks like extratrees is a superior split rule for this model, and larger values of minimum node size tend to do better.</p>
 <div class="sourceCode" id="cb11"><pre class="sourceCode r"><code class="sourceCode r"><a class="sourceLine" id="cb11-1" data-line-number="1"><span class="kw">plot</span>(models)</a></code></pre></div>
@@ -404,23 +404,23 @@ <h2>Faster Model Training</h2>
 <a class="sourceLine" id="cb12-2" data-line-number="2">             <span class="dt">outcome =</span> diabetes,</a>
 <a class="sourceLine" id="cb12-3" data-line-number="3">             <span class="dt">models =</span> <span class="st">&quot;RF&quot;</span>,</a>
 <a class="sourceLine" id="cb12-4" data-line-number="4">             <span class="dt">metric =</span> <span class="st">&quot;PR&quot;</span>)</a>
-<a class="sourceLine" id="cb12-5" data-line-number="5"><span class="co">#&gt;  Variable(s) ignored in prep_data won't be used to tune models: patient_id</span></a>
-<a class="sourceLine" id="cb12-6" data-line-number="6"><span class="co">#&gt;  diabetes looks categorical, so training classification algorithms.</span></a>
-<a class="sourceLine" id="cb12-7" data-line-number="7"><span class="co">#&gt;  Algorithms Trained: Random Forest</span></a>
-<a class="sourceLine" id="cb12-8" data-line-number="8"><span class="co">#&gt;  Target: diabetes</span></a>
-<a class="sourceLine" id="cb12-9" data-line-number="9"><span class="co">#&gt;  Class: Classification</span></a>
-<a class="sourceLine" id="cb12-10" data-line-number="10"><span class="co">#&gt;  Performance Metric: PR</span></a>
-<a class="sourceLine" id="cb12-11" data-line-number="11"><span class="co">#&gt;  Number of Observations: 692</span></a>
-<a class="sourceLine" id="cb12-12" data-line-number="12"><span class="co">#&gt;  Number of Features: 13</span></a>
-<a class="sourceLine" id="cb12-13" data-line-number="13"><span class="co">#&gt;  Models Trained: 2018-04-02 05:58:33 </span></a>
-<a class="sourceLine" id="cb12-14" data-line-number="14"><span class="co">#&gt;  </span></a>
-<a class="sourceLine" id="cb12-15" data-line-number="15"><span class="co">#&gt;  Models have not been tuned. Performance estimated via 5-fold cross validation at fixed hyperparameter values.</span></a>
-<a class="sourceLine" id="cb12-16" data-line-number="16"><span class="co">#&gt;  Best model: Random Forest</span></a>
-<a class="sourceLine" id="cb12-17" data-line-number="17"><span class="co">#&gt;  PR = 0.89</span></a>
-<a class="sourceLine" id="cb12-18" data-line-number="18"><span class="co">#&gt;  User-selected hyperparameter values:</span></a>
-<a class="sourceLine" id="cb12-19" data-line-number="19"><span class="co">#&gt;    mtry = 5</span></a>
-<a class="sourceLine" id="cb12-20" data-line-number="20"><span class="co">#&gt;    splitrule = extratrees</span></a>
-<a class="sourceLine" id="cb12-21" data-line-number="21"><span class="co">#&gt;    min.node.size = 10</span></a></code></pre></div>
+<a class="sourceLine" id="cb12-5" data-line-number="5"><span class="co"># &gt; Variable(s) ignored in prep_data won't be used to tune models: patient_id</span></a>
+<a class="sourceLine" id="cb12-6" data-line-number="6"><span class="co"># &gt; diabetes looks categorical, so training classification algorithms.</span></a>
+<a class="sourceLine" id="cb12-7" data-line-number="7"><span class="co"># &gt; Algorithms Trained: Random Forest</span></a>
+<a class="sourceLine" id="cb12-8" data-line-number="8"><span class="co"># &gt; Target: diabetes</span></a>
+<a class="sourceLine" id="cb12-9" data-line-number="9"><span class="co"># &gt; Class: Classification</span></a>
+<a class="sourceLine" id="cb12-10" data-line-number="10"><span class="co"># &gt; Performance Metric: PR</span></a>
+<a class="sourceLine" id="cb12-11" data-line-number="11"><span class="co"># &gt; Number of Observations: 692</span></a>
+<a class="sourceLine" id="cb12-12" data-line-number="12"><span class="co"># &gt; Number of Features: 13</span></a>
+<a class="sourceLine" id="cb12-13" data-line-number="13"><span class="co"># &gt; Models Trained: 2018-04-02 16:19:01 </span></a>
+<a class="sourceLine" id="cb12-14" data-line-number="14"><span class="co"># &gt; </span></a>
+<a class="sourceLine" id="cb12-15" data-line-number="15"><span class="co"># &gt; Models have not been tuned. Performance estimated via 5-fold cross validation at fixed hyperparameter values.</span></a>
+<a class="sourceLine" id="cb12-16" data-line-number="16"><span class="co"># &gt; Best model: Random Forest</span></a>
+<a class="sourceLine" id="cb12-17" data-line-number="17"><span class="co"># &gt; PR = 0.89</span></a>
+<a class="sourceLine" id="cb12-18" data-line-number="18"><span class="co"># &gt; User-selected hyperparameter values:</span></a>
+<a class="sourceLine" id="cb12-19" data-line-number="19"><span class="co"># &gt;   mtry = 5</span></a>
+<a class="sourceLine" id="cb12-20" data-line-number="20"><span class="co"># &gt;   splitrule = extratrees</span></a>
+<a class="sourceLine" id="cb12-21" data-line-number="21"><span class="co"># &gt;   min.node.size = 10</span></a></code></pre></div>
 <p>In this case we sacrificed just 0.01 AUPR versus tuning the models. In our experience, that’s on the small side of typical. A good workflow is often to do all of your development using <code>flash_models</code>, and as a final step before putting a model into production, retrain the model using <code>tune_models</code>.</p>
 </div>
 </div>
@@ -428,24 +428,24 @@ <h2>Faster Model Training</h2>
 <h1>Prediction</h1>
 <p><code>predict</code> will automatically use the best-performing model from training (evaluated out-of-fold in cross validation). If no new data is passed to <code>predict</code> it will make predictions on the training dataset. The predicted probabilities appear in the <code>predicted_diabetes</code> column.</p>
 <div class="sourceCode" id="cb13"><pre class="sourceCode r"><code class="sourceCode r"><a class="sourceLine" id="cb13-1" data-line-number="1"><span class="kw">predict</span>(models)</a>
-<a class="sourceLine" id="cb13-2" data-line-number="2"><span class="co">#&gt;  &quot;predicted_diabetes&quot; predicted by Random Forest last trained: 2018-04-02 05:58:30</span></a>
-<a class="sourceLine" id="cb13-3" data-line-number="3"><span class="co">#&gt;  Performance in training: PR = 0.9</span></a>
-<a class="sourceLine" id="cb13-4" data-line-number="4"><span class="co">#&gt;  # A tibble: 692 x 15</span></a>
-<a class="sourceLine" id="cb13-5" data-line-number="5"><span class="co">#&gt;    diabetes predicted_diabetes pregnancies plasma_glucose diastolic_bp</span></a>
-<a class="sourceLine" id="cb13-6" data-line-number="6"><span class="co">#&gt;  * &lt;fct&gt;                 &lt;dbl&gt;       &lt;dbl&gt;          &lt;dbl&gt;        &lt;dbl&gt;</span></a>
-<a class="sourceLine" id="cb13-7" data-line-number="7"><span class="co">#&gt;  1 N                   0.0677       -0.843         -1.19        -0.521</span></a>
-<a class="sourceLine" id="cb13-8" data-line-number="8"><span class="co">#&gt;  2 Y                   0.642         1.22           2.01        -0.686</span></a>
-<a class="sourceLine" id="cb13-9" data-line-number="9"><span class="co">#&gt;  3 N                   0.00366      -0.843         -1.05        -0.521</span></a>
-<a class="sourceLine" id="cb13-10" data-line-number="10"><span class="co">#&gt;  4 Y                   0.723        -1.14           0.509       -2.66 </span></a>
-<a class="sourceLine" id="cb13-11" data-line-number="11"><span class="co">#&gt;  5 N                   0.228         0.338         -0.175        0.138</span></a>
-<a class="sourceLine" id="cb13-12" data-line-number="12"><span class="co">#&gt;  # ... with 687 more rows, and 10 more variables: skinfold &lt;dbl&gt;,</span></a>
-<a class="sourceLine" id="cb13-13" data-line-number="13"><span class="co">#&gt;  #   insulin &lt;dbl&gt;, pedigree &lt;dbl&gt;, age &lt;dbl&gt;, weight_class_normal &lt;dbl&gt;,</span></a>
-<a class="sourceLine" id="cb13-14" data-line-number="14"><span class="co">#&gt;  #   weight_class_obese &lt;dbl&gt;, weight_class_overweight &lt;dbl&gt;,</span></a>
-<a class="sourceLine" id="cb13-15" data-line-number="15"><span class="co">#&gt;  #   weight_class_underweight &lt;dbl&gt;, weight_class_hcai_missing &lt;dbl&gt;,</span></a>
-<a class="sourceLine" id="cb13-16" data-line-number="16"><span class="co">#&gt;  #   weight_class_other &lt;dbl&gt;</span></a></code></pre></div>
+<a class="sourceLine" id="cb13-2" data-line-number="2"><span class="co"># &gt; &quot;predicted_diabetes&quot; predicted by Random Forest last trained: 2018-04-02 16:18:58</span></a>
+<a class="sourceLine" id="cb13-3" data-line-number="3"><span class="co"># &gt; Performance in training: PR = 0.9</span></a>
+<a class="sourceLine" id="cb13-4" data-line-number="4"><span class="co"># &gt; # A tibble: 692 x 15</span></a>
+<a class="sourceLine" id="cb13-5" data-line-number="5"><span class="co"># &gt;   diabetes predicted_diabetes pregnancies plasma_glucose diastolic_bp</span></a>
+<a class="sourceLine" id="cb13-6" data-line-number="6"><span class="co"># &gt; * &lt;fct&gt;                 &lt;dbl&gt;       &lt;dbl&gt;          &lt;dbl&gt;        &lt;dbl&gt;</span></a>
+<a class="sourceLine" id="cb13-7" data-line-number="7"><span class="co"># &gt; 1 N                   0.0677       -0.843         -1.19        -0.521</span></a>
+<a class="sourceLine" id="cb13-8" data-line-number="8"><span class="co"># &gt; 2 Y                   0.642         1.22           2.01        -0.686</span></a>
+<a class="sourceLine" id="cb13-9" data-line-number="9"><span class="co"># &gt; 3 N                   0.00366      -0.843         -1.05        -0.521</span></a>
+<a class="sourceLine" id="cb13-10" data-line-number="10"><span class="co"># &gt; 4 Y                   0.723        -1.14           0.509       -2.66 </span></a>
+<a class="sourceLine" id="cb13-11" data-line-number="11"><span class="co"># &gt; 5 N                   0.228         0.338         -0.175        0.138</span></a>
+<a class="sourceLine" id="cb13-12" data-line-number="12"><span class="co"># &gt; # ... with 687 more rows, and 10 more variables: skinfold &lt;dbl&gt;,</span></a>
+<a class="sourceLine" id="cb13-13" data-line-number="13"><span class="co"># &gt; #   insulin &lt;dbl&gt;, pedigree &lt;dbl&gt;, age &lt;dbl&gt;, weight_class_normal &lt;dbl&gt;,</span></a>
+<a class="sourceLine" id="cb13-14" data-line-number="14"><span class="co"># &gt; #   weight_class_obese &lt;dbl&gt;, weight_class_overweight &lt;dbl&gt;,</span></a>
+<a class="sourceLine" id="cb13-15" data-line-number="15"><span class="co"># &gt; #   weight_class_underweight &lt;dbl&gt;, weight_class_hcai_missing &lt;dbl&gt;,</span></a>
+<a class="sourceLine" id="cb13-16" data-line-number="16"><span class="co"># &gt; #   weight_class_other &lt;dbl&gt;</span></a></code></pre></div>
 <p>To get predictions on a new dataset, pass the new data to <code>predict</code>, and it will automatically be prepared based on the recipe generated on the training data. We can plot the predictions to see how well our model is doing, and we see that it’s separating diabetic from non-diabetic individuals pretty well, although there a fair number of non-diabetics with high predicted probabilities of diabetes. This may be due to optimizing for precision recall, or may indicate pre-diabetic patients.</p>
 <div class="sourceCode" id="cb14"><pre class="sourceCode r"><code class="sourceCode r"><a class="sourceLine" id="cb14-1" data-line-number="1">test_predictions &lt;-<span class="st"> </span><span class="kw">predict</span>(models, split_data<span class="op">$</span>test)</a>
-<a class="sourceLine" id="cb14-2" data-line-number="2"><span class="co">#&gt;  Prepping data based on provided recipe</span></a>
+<a class="sourceLine" id="cb14-2" data-line-number="2"><span class="co"># &gt; Prepping data based on provided recipe</span></a>
 <a class="sourceLine" id="cb14-3" data-line-number="3"><span class="kw">plot</span>(test_predictions)</a></code></pre></div>
 <p><img src="data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAASAAAAEgCAYAAAAUg66AAAAEGWlDQ1BrQ0dDb2xvclNwYWNlR2VuZXJpY1JHQgAAOI2NVV1oHFUUPrtzZyMkzlNsNIV0qD8NJQ2TVjShtLp/3d02bpZJNtoi6GT27s6Yyc44M7v9oU9FUHwx6psUxL+3gCAo9Q/bPrQvlQol2tQgKD60+INQ6Ium65k7M5lpurHeZe58853vnnvuuWfvBei5qliWkRQBFpquLRcy4nOHj4g9K5CEh6AXBqFXUR0rXalMAjZPC3e1W99Dwntf2dXd/p+tt0YdFSBxH2Kz5qgLiI8B8KdVy3YBevqRHz/qWh72Yui3MUDEL3q44WPXw3M+fo1pZuQs4tOIBVVTaoiXEI/MxfhGDPsxsNZfoE1q66ro5aJim3XdoLFw72H+n23BaIXzbcOnz5mfPoTvYVz7KzUl5+FRxEuqkp9G/Ajia219thzg25abkRE/BpDc3pqvphHvRFys2weqvp+krbWKIX7nhDbzLOItiM8358pTwdirqpPFnMF2xLc1WvLyOwTAibpbmvHHcvttU57y5+XqNZrLe3lE/Pq8eUj2fXKfOe3pfOjzhJYtB/yll5SDFcSDiH+hRkH25+L+sdxKEAMZahrlSX8ukqMOWy/jXW2m6M9LDBc31B9LFuv6gVKg/0Szi3KAr1kGq1GMjU/aLbnq6/lRxc4XfJ98hTargX++DbMJBSiYMIe9Ck1YAxFkKEAG3xbYaKmDDgYyFK0UGYpfoWYXG+fAPPI6tJnNwb7ClP7IyF+D+bjOtCpkhz6CFrIa/I6sFtNl8auFXGMTP34sNwI/JhkgEtmDz14ySfaRcTIBInmKPE32kxyyE2Tv+thKbEVePDfW/byMM1Kmm0XdObS7oGD/MypMXFPXrCwOtoYjyyn7BV29/MZfsVzpLDdRtuIZnbpXzvlf+ev8MvYr/Gqk4H/kV/G3csdazLuyTMPsbFhzd1UabQbjFvDRmcWJxR3zcfHkVw9GfpbJmeev9F08WW8uDkaslwX6avlWGU6NRKz0g/SHtCy9J30o/ca9zX3Kfc19zn3BXQKRO8ud477hLnAfc1/G9mrzGlrfexZ5GLdn6ZZrrEohI2wVHhZywjbhUWEy8icMCGNCUdiBlq3r+xafL549HQ5jH+an+1y+LlYBifuxAvRN/lVVVOlwlCkdVm9NOL5BE4wkQ2SMlDZU97hX86EilU/lUmkQUztTE6mx1EEPh7OmdqBtAvv8HdWpbrJS6tJj3n0CWdM6busNzRV3S9KTYhqvNiqWmuroiKgYhshMjmhTh9ptWhsF7970j/SbMrsPE1suR5z7DMC+P/Hs+y7ijrQAlhyAgccjbhjPygfeBTjzhNqy28EdkUh8C+DU9+z2v/oyeH791OncxHOs5y2AtTc7nb/f73TWPkD/qwBnjX8BoJ98VQNcC+8AAEAASURBVHgB7V0HnBRF1n/kzTmxu7AsCyw5R1FAUUFQzxxQ9DyRE/U89Mw5fyp3hjNhAMwRRUUOwQQISA6CZCRnUIJkdL73r6XG3tnumZ7untj1fr/d7umu+K/u11WvXqjmYSJFCgGFgEIgAghUj0CdqkqFgEJAISAQUAxIPQgKAYVAxBBQDChi0KuKFQIKAcWA1DOgEFAIRAwBxYAiBr2qWCGgEFAMSD0DCgGFQMQQqBmxmkNQ8f79++nw4cNVSq5duzZB2+Do0aNV7pm5UK1aNapRowYdO3bMTPIqaZC/Tp06dOTIEfrjjz+q3DdzoWbNmvT777+LfphJ75sG+dEHPXx80xr9Bo7og1UCBuiDHRydGAdgoKd9kpWVZbVrKp9FBCLGgH799VeaO3cutWjRgurWravb/PXr19PmzZu997Kzs6lx48be374nYDB6L1hqaqpgPr/99ptvFlO/8dDj5QODs0J4+TMzM+ngwYOWX+BatWqJl9cqE0X7ExISaO/evVa6IPIkJSXRvn37LOdPT08XGOiNkZlCgQGwtJMffcA4WmWCZtqp0phHICIM6LPPPqPRo0dTjx49xLFp06Y0dOjQKq1+7bXXaNu2bZSRkSHutW7d2i8DqlKAuqAQUAhENQJhZ0CYgr/11ls0bNgwKi0tpcsuu4wuuugiuvLKK8UsQYvWypUr6YknnqD69etrL6tzhYBCIE4QCDsDwnLmjTfeoOTkZAHhoUOHCEsjMCYtHThwgH755RfasWMHTZkyhXr16kXFxcXaJDRz5ky6/fbbvdduvvlm6t+/v/e3PKlevbqQf0AGYZUgx8ESxg7JmZyVMlA/lg9WCfnxl5eXZ7UIAo5286MPiYmJlttgFwdUrGQ9luF3PGPYGRB6IJkPBLLPPvss9e3bl3Jycip1bvXq1WKtP3v2bPHAYol21VVXVWIwubm51K9fP28+yJIgZ/ElPPCoy6rsAA895A9WBbB4cfHiIb8vo/Vtq9FvyHAgt7AqxEZ+yE/08DGq0/c6GDA+GFYJGKAPdnBEH+zkRxvwHOjhmJKSYrVrKp9FBKpFyhgVD8FDDz0kdiMeeOABIeTV9gEPKgSeEN6Cpk2bRiNHjqQRI0Zok1U63717t+4LBuYG4e2ePXsqpTf7A7M2ME2rAly8NGCWu3btsvzy4OUAZlaF0BDEgxFv377dbLerpMNYYPPAKmH2BAZoVZCNjwBmsVY3E5AfzwJm1XpCaKPNEKv9VfkCIxARPSAsr2655RbCS/Hwww9XYT5oNpiJ9mGHHAgCab0vV+BuqhQKAYVANCIQEQZ0//33U3l5Od1xxx1CNqMFZu3atWKaj9nKTTfdJL6Y0Nn44osvqGfPnkIOoU2vzhUCCoHYRSDsMqClS5fSjBkzxN+HH37oRe75558nbLMPGTKEHn/8cWrTpg2dd955NHjwYDFdTktLE7MlbwZ1ohBQCMQ8AmFnQM2aNaPvv//eELjx48d772FrfuDAgWLNDwYUaoKC2nPPPSdmWTfccIOtXadQt1WVrxCIBwTCzoCCBQ07SOFgPmjX4GuuoelTpwnB+MIFC+idd98NtrkqvUJAIRAEAhGRAQXRvrAlnTRpEn3Hf0PbdaBb2ncW59rZWNgaoipSCLgIAcWAjg/2KN7iL0nPoB5F9al7UTE1ycqhl4cPd9GjoLqqEAg/AooBMebY8v/uu++od/GfJh/9G5TSLFaCXLNmTfhHRdWoEHAJAooB8UBj+XWMTUFOKPzT1OOEusVUixUQx44d65JHQXVTIRB+BBQDYsxha1aUlk51k/9UxU9irdm2ufk04csvwz8qqkaFgEsQUAyIB3oqqwW0zsquMuQd8wpowcKFlTSyqyRSFxQCCgHLCLieAcE2auOmTdQ8u7IxLBBtn5cvtuSnTp1qGWCVUSGgEDBGwPUMaN68eQKdpplVZ0CFKamUy8syGMIqUggoBJxHwPUMaAErHKawhTWYjR61yMyiGdOn691S1xQCCgGbCLieAS1evJjKWP/HiFrw0mzZihWWXXkYlauuKwQUAkSuZ0A/LVpEpanphs9CU1ZIhDX+nDlzDNOoGwoBhYA1BFzNgOBvaBs7pyrlaA1GVMJGsAm8Ja8YkBFC6rpCwDoCrmZAy5cvF8iVsA6QEdWoVp0aZWQqBmQEkLquELCBgKsZ0AqW7YDqpfh39dEkPZPmslmGIoWAQsBZBKLeHUcw3YXrDr3IFXAqD7/Ovvdg51WQmkZJ7LDdHzVhJcVPVi0XColW/AajXSA4hpfn/urTuwe/0pBFoR9WCPmAgy8GwZSlh2Ew+VE/+mG1Dajfbn60F36lUY6iyCMQd6OAh9yX5DV5lPdX8gyomJ3N+16X9+URSzDQQtaKLiwslJdNH2X5OMpz05k1Ce3kl/XKo6bYoE7t5kdlVstAPvkXVKOPJ5b12inDSr0qjzECccWA4LBeL+wMIlogHI7vveXLllOHpJSAoXLqJiWLWRKUFnv16mWMpsEd+bVFVAurIWXw9bcTFQNtQFQIXwwMmqx7GTMXO/kRhADRKKyWgfaD7ORHGxBaSC8qhp24bbqAqYsBEXCtDAgv8+atW6jIQAFRixy+mA1ZDrSIt+wVKQQUAs4h4FoGtH79eiFTKTQZjK4h75QtVgzIuSdPlaQQYARcy4CkozGtCw5/T0QZy4E2bd5sOTihv7LVPYWAWxFwLQNC/LEavLTKSzQXb73hcXONJUuWuPVZUf1WCDiOgGsZEJZgeSyQrHF8izwQsiWsLV2dGZZiQIGQUvcVAuYRcC0DWrduHRUkmJv9AM46NWoKr4kIrKhIIaAQcAYB9zIgXoLlJ5lnQIC7hH0D/cTW84oUAgoBZxBwLQPauHEjM6DkoFBswHIgmG9AI1mRQkAhYB8BVzKgXbt20SHWA8oLcgZUylvxBw4eJMiPFCkEFAL2EXAlA9qwYYNALtgZkLSaV3Ig+w+eKkEhAARcyYCw/ALlJQa3BCvgJVsimwMsW7ZM5Ff/FAIKAXsIuJIBbeIoGNh+z2TbpmAIJhn1eRmmZkDBoKbSKgSMEXAtA8plA1Xo9QRLJWw7tvSnn4LNptIrBBQCOgi4lwElJOrAEfhSA54B/cxb+DBmVaQQUAjYQ8CdDIiF0Dl1rDKgDILbj5UrV9pDXuVWCCgE3CmEhlFpTqJVBlThP1oJotXboxCwj0DEZkCISPH111/Tli1b/PYCjuMnTpxIO3fu9JvO7E04BNv1yy+UG6QOkCw/nd15ZnJeJYiWiKijQsA6AhFhQJ999hndeOONBJcYDz74ID3zzDO6PXj66adp2LBhNH/+fLr66qsdUQDcunWrqCsnCDsw38Y1YCf2igH5oqJ+KwSCRyDsDAiuUd966y166KGH6JprrqGnnnpKzIQwI9IS3GV8//339Morr9Dtt99Ol156Kb3zzjvaJJbON/PyC2R1CYa8DThW2JLFaicMWChSCNhBIOw+oeHb+I033iD4aQbBP+9vv/1WxS/zzz//TK1bt/ZGkWjfvj2NGzeuUl9h0T527Fjvte7du1OjRo28v+UJIlHAJ3IKez/cvXu3uJzPrjikr2aZzt9RloE0ZRlZNGbVCrETlp2d7S+buCcjYSSy3AmRMayQjKiBiA5WCP6UoccEDKwSxs5OftSPflgtQ46B1fxoPyiJl9DYSFAUeQTCzoDQZcl88BA8++yz1LdvX8rJyamEBmRD6ZqIpWk864ANl5agUPjmm296LxUVFVGbNm28v+UJHnz58O7gSKg1+UHMYkdkuB4MyQe4jMP0gFavXk3169c3XYTVcDSoAG2VTtlNV6hJKPsqsdfcMn2KMuzmRx+CYfy+jbOLA8rDh0BRdCAQEQaErkOPBsswWJbffffdVdDAy47lmiREMfB9cE444QSaNWuWTCJmN9u2bfP+lidgbkePHqU9e/bQqlWrKIdNKoKJToGHHu2RkRTq1klgb4rVadq0adS8eXNZjeERL1xubq6IKxZMvdoC8dW3ExUD0SCA3/bt27XFBnWemZkp+hBUJk3ivLw8EdFi3759mqvmT8G8MAPEjNkKIT+eBXzI5Fhqy7ES802bX50Hj0DYZUBo4oEDB+iWW24hvBQPP/yw7rIEL+wvvFslCedOPCCYWWVbXMbIttRiZlTMs7NY846IF99qSBvZd3VUCDiJQEQY0P3330/l5eV0xx13VIn0CeEz5EKdOnWixez8C5br+FpB1tO5c2fbfd/CQuis2sHZgOlV2oBNMn6KkSgZCCd02mmnE2YwkJFddvnlBBmbIoVApBEIOwPC9vWMGTPogw8+oB49enj/fvzxR4HFkCFDCLo/kPkMHjyYBg0aRAMHDiR8vQcMGGAbr62YATkgA4CT+uWsDa03lbfdSAcLmDRpEp119tm0at1m6j3gJup+zmCau+AnlrudQXPmzHGwJlWUQiB4BMIuA2rWrJnYXjdq6vjx4723zjzzTOrTp4+QfVjd+fAWdvxkOys0ZjXJ9b0c9O8yZkCQK8EkA32KRoKQfNCgayi/pBmdNeQRSmD3I5AjlXc+lcYNv4cGXnEFTZwwgerVqxeNzVdtcgECYZ8BBYspBIdOMR/IkcA0si0aomrbjkipICwTo5Gww3jDDf+gWkmp1Odv91ItzbIzga/1G/wg/VGtJl3LM061JR2NI+iONkU9A3JyGOQOWZYDDAgmGTmsyxSt4ZrfffddWrhwAfW6eCjV0XG8lpiSQSdf+i+az/HuoZelSCEQCQRcxYCkGUZWkI7IjAamUVoG/bhwodHtiF3HTteTbMJS1qY7FTdpa9iOeuXtqLzjKfT4E094FTQNE6sbCoEQIOAqBiR1YJyYAWEsGrEcCEuwaFvCYPazi2VdnftdGfCR6XrWVbw1f4hefPHFgGlVAoWA0wi4igFhCZbAMqUk/nOCGrFJBqJkQNgbLQTlzZeGv0wNW59AWQWBtbRTMnKp+Qn9aMSIkZX0rqKlP6od8Y2AqxgQZkAwwXCKmrBeDQjW+tFCcF2yedNGatPrPNNNat/7QjrCwvmRI0eazqMSKgScQMBVDAgzoMza1ow59cBOZ5OMAtbmjiYGBE8DucUNqW7DFnpN1r2WnJ5NTTr2ZgY0SiiB6iZSFxUCIUDAXQyIfQFlOciAMB5NWBA9d/bsEAxN8EXCOHfy5MnUrGvfoDO3PflcFkT/Sp988knQeVUGhYBVBFzFgLZjBuTQDpgEvClbxi/lOGGwb4s0ffzxx1S9Rk1q3OHkoJuSVVBC2BUboZZhQWOnMlhHwF0MiF1xOM2Ammfl0O+s9BcNy7DRoz+mBi06ExQNrVDL7mfS0iVLaO7cuVayqzwKgaARcA0D2rt3r4gH75QOkEQaNmGIljpz5kx5KSJH2NitWrWSGrcPfvYjG9ygZVdKycimt99+W15SR4VASBFwDQOSWtCZFsPxGI0CIqw242XYD9OnGyUJy/XPP/+canPfSpp3slxfdXYzUt7pNPqMy7Lqc8dy5SqjKxFwHwNyWAaEp6ZVdi7Nnj1HGHpG6in64otxzHw6U02bQvZmXfvQIdZtQuAARQqBUCPgPgbEW+dOU5vcPNajOVLJO6PTdfgrD4qQq1evolJWPrRL6Tl1qbhxa3rv/fftFqXyKwQCIuAqBoRY8DAidZoas0Z0Gs+svvvuO6eLNlXeBHapUYN3v+wsv7QVYRk2jwXR0aThrW2fOo8fBFzFgNLZERmYkNOEMtvn5NFXzAgiQV9yvUU8a6ltI9aZtt1lbU+iWjxT/Oijj7SX1blCwHEEwu6QzPEeaAqE83e4HfUlOJRHZFUYocK/kBUKFI2he3F9enTGVELUjSZNmlSqAnlB8IFt1XAVfUBIGzjx1xLiqWG20uP86/z2TbbBTP+RphEzoY8/GUOPP/64N3oIruvhq22Pv3NEJkFkEKtRMWRwADN90GuHxADeNn1x1EuvroUegbhiQHCPqhdxAZEQEJAwnV8gOCQLluSD78/9arucXKrNDBCmEDfffHOlKmRUDLTN6agYn376qWBqxU07+O0b2gAmZrb/UGb8fOZXBA+V3bp1E/1xIioG/H3rjVElwAx+gPHYjYqB/FDJ0BtLJ4IeGDRdXTZAwD1LMPYFnanxCmiAh+XLiTVrUdf8Qvroww/D+nX99ttvKSu/mCA8dpKKG7cVOkHQrlakEAgVAu5hQNu2U0aC8wJo7cCcVtKA1q1f79fntTa93XMsI75jp/PF5R3sFlUlfzVeLjVq14s+/3xsRNULqjRMXYgrBFzBgPCi7uRgdJkh2ILXPg3tcvOpHmtGv/D889rLITtHXDI4HqvHy69QUHmn3qyQuI++/vrrUBSvylQIkCsYEJzRH/v9WMgZEGRFlzQqp++nTiUsjUJNU6ZMEdvvRY1ah6SqnKKGlFPYgGBjpkghEAoEXMGApBlGRohnQBignrwb1oK35G8aOpQ2btxYaczAMK677jrq0K4dtW/blm677TZbXghRXkFpc7FlXqkiB3807nAKffPNN7ZCMjvYHFVUnCHgLgYUAjMM3+cBs6Bb23cmz4GD1K9vXxrGzuEfffRRat60KZ133nk085tvqXNKGv+l0xgWWJ/Zv79QEfAtJ9Bv7KbNYAPYIj9O5wOVYeY+dsOOHTtKX3zxhZnkKo1CICgEXMWAMkOgBa2Hdm5SEv3npJOpeVIKvfzCCzSSfTRn7z9ID57Qg149pQ8NbtWO/t66HT110in0C/so+scNN+gV4/faPA6nc5i3tOuFmAGlZuYK04yPRo/22x51UyFgBQFXMCAoB0JbOdWmoWYwAOew7+nbO3alj/qdQx/0+ws9eGIv6lxQ6FXqQ1nFqWl0Q6v2NJmXUv/73/+CKZ6mspwJ1u959cuDymclMZZhc9jr49q1a61kV3l8EJjNWD744IOWTF0w84UulROEKLlox4YNG5wozlIZrmBAkAFlMEMIhRmGJdQ1mboXFQuZ0bAnn9RcDXw6deo0qlvWgj0g1gic2GYKmGbUrFWb3nvvPZslqexA4IEHHqB///vf9NRTTwUFCLTeW7duTetZ1cMJAiNDWxQDcgJNP2UgGobTnhD9VBf0rYsal9PyFSvErMZMZjw48+fPo8JGbcwkt50GkVXhrOztd96xXZbbC4BGPoyHH374YeH4LRi/S7t376bly5fHFYSumAGBAWXwFzxaqUNegYiu8Y7JFxwuU2FSEartdz2cyjlqxs/s9kO5a9VDx/w1hMEuKysTu6EwjUEQSV/CEg3mPGeffTY999xzhBn8/v376c477xRJ77nnHvrqq6+Ewit2UrUE05wnONKtJCyznuTZ9YUXXkh9+vShG2+8kdatWydvR/zoCga0lc0wMsIkgLYyotg5611Un75kuys8aIHohx9+YMv3RMqt1yhQUsfu12/WkZLTMpWFvE1EEXvtsssuE4bFF198Mb300kuVSoRr3969mdn//DOde+65IkrJ+eefLwx427SpmPG2atWKCgoKaBkHQ/BlYHPmzGHt9c+9ZYLpvM++nVDmGWecIfTTTjnlFMtG0d6CHTpxBQM6wl+B2uwvJ5oJ+kOHWcCIL1sg+uGHGUL/p3r10Mt/ZFsga2rCwugx/IXFV1VR8AhAbws+lq644gqR+aqrrqIFCxbQjBkzvIXdcsst4j5mMrgPlyjwgrBmzRq65JJLRDowLjChQLSLtf/z8vIIM+trr72WhrJuGtRCwNywMRMN5AoGFA1AB2pDUUoqlbAZB+QD/gi7IPPmzeXAgy39JQvJvebd+tA+tiRH9FVFwSOA2U9paSktXLhQuLzdwjPzrKwsGj58uCgMJkNgSKeddpq3cHhygFZ9U9YjC5ays7PpQ9Y1wwfj9ddfF0u4Rx55RBRzkN3uRgMpBhQNo3C8DZ1ZFvQtax0jvrsR4eHFA1VYFvgLaFSG1eu5xWWUx8s+5a41eAThgkQ6eLv33ntJ/sE30QcffCA04rH8hlA6OTnZdAW+fo207lawWdGXlWF79OghlmFJrJ+G5V80kWJAUTQaHfLr0j5+AKFkaESQEdRg1x/5JZWdnhmld/p6eefTaApHX8XXW5F5BMBk4IwOY/vjjz96/7D8gm8izFBSUlLEkkm704U8F1xwgYh4C1khSDIdPd9IWKpJwjIOZjQ//fQTffnll4LpFRYWittWHePJsp06RpQBgdtPmzbNsC/Qd8AAyb+VK1capo2HGwjvk1Crll93HjNnzaKCknJmQpHZ1YMcqBrLnjC1V2QegREjRtBZZ51F6enplTLl5+dTfzbHefnllwVjueaaa4SOEJa5WG5jFwxKp506dRLLNWTGTuSePXuE5004V8POGmY+ED5rTWYgqMZsWtpCYvfr7rvvFvU7pcxYqTMWfkSMAUklKH/hX1577TUaNWoUjRkzRvzN4pcvnqkm++BpyZFWp37/vW438eUDBvmlLXTvh+NiQnIqNeToG+/w9rH8Eoej3liuA0Ej8REdOHCgbjf+9re/0QrWA4OsBwzi9NNPp379+glmBUaPdwDLJyzXsKTCMuqhhx6irl270j/+8Q+6+uqrKZH9nUOr+Y477vDW0atXL0LZ2AGDt8eTTjqJ7rvvPsrIyIiKSL5oaDV+iCo7GfY2P3QnkMLfddddAmB8EaCnoEeXXnqp0GmoX7++3u0q16CopSdcO/3UU6newSN0Q5v2VfKYuYCpL3Q29Nx4ms2P6TK+aIGmvh+tWErvrFwmHkjkkYTpOeQ/eIj6D35IhGCW98wcpUtWOztYcImKL+2G5fPp8xfvFHIFyBfMEnZkMD6RdMkKoS52gPTGMppcsmKc8DxjhuRLwA8MCc8k6MCBAwJTvbS4j+cOPtHl8gvXooUisjcNwMDpsU1oZAOFNPDjg4cF25fg5sXFxZVwA7BQT5cEXgrH50Yk19BG942uI5/8M0rj77q2Xu25Xp5W7Mrj6JJFQkbQpUsXbxLkg4IaqLBhi0o2Zd5EJk4C1R+oCOSvV96OMnILhWY0xiUYQn5/Y+SvLOSzmx/loxyrbfDXPifv4eNjxFAQ3EBLYEb4MyJs40cj80F7I8KAWras2EKeNGmSEWZCXwJfAbx0mF5ChwF6EVgvS4JC3uDBg+VPod5+0UUXeX9rT/DgamcU2ntmz+UXx2x633R4EAJRi/wC4dwe03ZowmoJW7S5RaWUlpmtvRzUuVMYtDrpLPry8xGibqMXRa9h2OEJZpdHrwzMBu0QtqcVRQcCEWFAZrrerFkzIfeRYWAaNWpE0KPQMiAwsuc17k9LSkoMHXxhdoQZkxWSX11/2+P+ykV+uXwxs+JFoMNJHOQQAklJYMKTJk+hvJLmlvoB5omvvnabVpZt9ohlnFy6wDRjOjOg//73v/Svf/3LVBFYbmMM9JbJZgpA/cDRTn7IUSDA1RtL6OQoCi8CUcuAsP6FhF8yIMiBIM2HDEVOn/El0yptGcmAJKSB5C8yne8RDAR/dvKjTDAfM2WUZ2TSZJ75aeU1WGquX7eWep94gakyfPsgMTNTv29e+Vvb/jrJaVTWtgd/FEbRkCFDvPIImdboiBdf2y+jdHrX0XaMg538KBdMUDJSvXrUtfAhYCww8WkDmEE4aC37nMEOGb5SN910k/ja4cHH9mLPnj29zCccbYlUHeWZWbSL5V9al65yBxAuWKOFWp54Jm3duiWg9na0tDfa2oFdL+xwgRYtWmS4GePbbsxiseNl16g0XO+0b/u1v00zIET7hHwFQmO96au2UDvn+JpCEQsWw3BhChnPgAEDhIr6lVdeaafomMnbmBkQCDIfSVBATErNEMJfeS3Sx7rMDKEZPWLEyEg3JSbrBwOCWAEEBgQfQWYIDAh+fPCxtkp4j7GlH2kyzYCgRo71M7bGsRt16623Cg1LOx3ADorvFjwicUqrXzAcKFlBSQt/2MZ1A+UnJVM6W7tj213SD6xHkt+gmfwZNceWJ51NP/wwnSA0V2QdAXxk4TYmXLR48WJTnhdC3R7TDAj6J1AM3Lp1Kz399NPigevQoYPQ0HyB/R5jyRQKguwCjM9t1IgNUxcenwHhi7dg/gIqiEIG1KRDL0rmmRmeDUX+EYD+G9RPsJGCD692JYEZLnZ6JUHOFciPDxjW9ddfL9xsYEnmK5zHDBobGVBsRNlwhgaazKY0iHiLJT7uS1UWo/SyTZgMnHPOOUJJEr6JoCZjl0wzIFkRdmPgFgAalYMGDRLLBDhFKioqIrgSsLPLIutQRyIwIEzLQfhaHTlymLDkiTaCSUjz7v3FAw29LkX6COBlPZUVYrHsOvPMM8UOL3YQJa1atYreeust+VM4DwvkxwdazvjwYyPm1VdfrbSkQj3dunUTxq1wRgYGB3euYEJYSWAVA92hzp07C3cf/tKjUW+++aaQyWIiAncgSI/+2KWgdsEA0ttvvy38i8DoDWtIgAQbF7wsaBj0TBCGRpE9BMrSM2kPa0XjKwXbH/j+yYuQAWqgnrQ88Sya93WFyQA+QoqqIoBVA/SXpk+fLnbyIOuEKYUeST8+cFYGdRRQeXm5mHlAMVcqIkImCxszUPfu3UV5iGILxoBxgAMy6ccbM5327dvTY489JlRXoOSK91mqegRKD5vNjh07Ck+N2IkEI4IZFWZqdnTLTDMgeFH7jnVTAAgaDbsWreo6lmPw4IavtSL7CDRkex0QGDsYUG5xQ6pVO8HSFrz91vgvAcLxJqwXNGrU62JJgFmyosoIYHkDmSdeXkn4gMNa3ZekHx/keZ2t5LEpA2sAEJZZkgHBXkwSmANsvPCsgDlAfoj3U2sbBl0weEz0JTCRQOmx6gFDgz4e6sUsDnZo0M2yQ6aXYOCeMKhDPHIsubTMRzYA/malVF9eU0drCBSwIDqJNafhSmH2nLnsfiP6BNDanrU9+TyWJfyirOS1oGjOoaOmlfngFpQq9cisH5969ep5s4O5gHGBmWB7HTpTmHFBhir/sFSDe1dfMpP+5JNPFuIWMCJY54N5YhaFftkh0+wLHBJbf74EDg3XAfBNqwXEN536HRwC+FKWpmUI/zGbN22klr2jy5GUb2+yCupTKUfOeJGXDZdffrlpxUTfcuL1Nz7gvnaPerMf9F/68YHQWr5TuAbSKpLinYQMBwSRCNy9Nm7cmHJzc8XGDey/sOSShPdUMj3tTMxMenjqxMwL4hX8zZ8/X9SN6xC9WCW/MyAIruDCEX/geo8//rj3N65B8v7ss88qrVKr6AfI14ADFy5i51WggtLongGhje1OvYg2sA8nrU8aXFdEQn0F/q3wvmAZBTcbRr6wzPrxgRkSdqXxh0gZECz/5S9/EXBDxgShNnwEYeaFJRzuwSoeBLMTOJWDGxBohQdKD2YHsQt8ckExGHUiH/T17JDfGRDWewgPgmkddrfGjRtX6csGbtqgQQPhWsNOI1RefQQasu3UuDWrKJHNHjLziit9/fRzRPYqdumKylrSf9mJlnwRItui6KkdAmdoPd9+++1ChAEDXjinR2QLX4KsSPrxwU4V3jM4k4djecw88M6BsJ2PdxTvJq6B2Uir+Pvvv1/sgMGbIuQ0qA+6e9gRA8GNCpZtEG7DqDtQeohXUDd21rBExLIOzBSyJztk2h8QLLOxzLJriWynsYHyGtmCxZI/IG0fl/2yi/415VsqbNyWLhw6TDAg7RRcmzbQOR5CPHD4mFglvAiB1CzW/jSLxr1yn9gtxcaFlpQ/oAo0Nm3aJNxjaJdBWpzkOWzWAvnxQRrsjEENRo8wXrCh9HVlI9PinYHwWlKg9Hj+0H6UF6j9skx/R78zICzBwHBatGghLJ7xW4/AXaWLDb376po1BIqP+31JyzPnkM1aLc7matCiM+/YldEz/HX0ZUDO1hS7pRkxC98emfHjgzT+ysNHw4j5oD4t88HvQOkx85FyKaS3S34ZEFw9QnkJMx9MqY20nTGtUz6C7Q5F1fw72Ckb29BTQmbdqjej+Er7Uy+mCa8/JnZNjXRdorj5qmlhRMAvA8KaT06z/NmpgCsqch6B5b9WaBbXSI4tB1plbU6krPxieuaZZ4SiqvPIqBLjBQG/nAPTMalohCPUr0GY9kGNHDMfRF2UaeIFlGjpx3LWq0lKyeKIqb9HS5NMtaMaf5Da9b5Y7LxAmc7thF2jUP7FMr5+Z0DajsGIDpJ46Bpg+xAalpDCQzoOybsdXQBtPer8TwSWMgPKyC2lo7zdCeExPgixQk06nkJzJr7DhsvPsEeD12Ol2SFpJwS9MJXw+Ak4aaniatXoxn/+U2yhW8ofBZlMMyDYpUCRCm5PsR0I5gNbENi4wB5MMSBnR/MA715s3LuHWjcvoUNcNGKoSe+QztYUmtIQS77tKRfSVx8+J7TnmzePPkPa0PS8aqnQl4G7knZ5+VTIYY2cognroifGu9U+mWJAsORFKJBerJ8AJapJkyYRGBIIikiffPKJ1fpVPgMEVu7+lcXPRHXzS2nNH7HHgNCtZl1Op3kT3xM7Yq+wPye3U98GZdSzXoljMEzZvNGxsiJVkCkGhC8vllnfc8A8aE9C9wC2IODsCDkLO5FoIOi5SEM93/bwbNWWrAqCdquyLinIR/vMCuxX7dnNejs1KSe3iLawmwvEDQ8mv2//Zb1W+4Dy0I9g8iNte9aOHvfxS8INBNQ1ID80GiPfNvv+lmMg8fS9H+i3xABROazqUwWqQ90PDgFTDAgDDhlQnz59xMDBChbq4nBOBN0gaHdGA0HlHMxRj1gOWMUYUC+d3jX0H3++xoR6afWuIS+YB/JDGGmGlu7awcaFRVxvdUpgRgSDwWDy69Uh26B3z8w1Kxg069qX5kx4VwSYhGsIKLoh5psVAkOD6wer+SFDw4cUmrz4ePpSNCvZ+rY1Xn6bYkDoLITOMMfH4EkDuH+yAAznduM8OQmmPyZh9uXXa4/cxdC7F8w1s22AALqgrCMzLKJEfvF2sgwIZDa/UZvCnb9GrdrUutd59PEnbwiDSWnnZNQ+f9cxg8HMxd8YB8qP+8hvtQx/5at7wSPgdxvet7imTZsKNxxwZASjNGhYwsMalmWKnENg58EDtPvQQcrJq5AXgAHJnTDnaglfSYieUbtOothFDV+tqqZYQMA0A4IPWXy9sAuGCBnaP8yEFDmHAPR/QNm5FSYYYEAgyIFikWonJBGc149i1y2wolYUOgRgkAqnZFqCEnG0WiqYZkDXXXedV+aD2Y/2T+vbVttxdW4NgRXMgBLqJFFqWoUGNGRAIGzFxyq16XmOkGc9x5byikKHwBNPPCFcJEtH86gJfoXgwz0ayZQMCAJQcFF0zi2hcSI5WMuYAWVrDFCrsxC7Ds+CYnUGBCwT2KUIlmKvcvQM6JH5GkFGEu94qxvCdigIa53cR2sfTc2AEBantLRU159stHYsVtv1B0udV7EOkFx+yX4k8iwolmdA6EcH3pLHLuXrvBRTFDoE4LEQ3haxHIt2MjUDQifgARGhkhGlAcxIqw+CWRFcdiiyj8CGfXvp0LGjrP9TIYCWJUIOtCuGl2DoR2pmLjXtdCqHkHmN/v73v5NyXi9H19kjvB0ikCeiCp944onOFu5waaZmQKgTMiC4b8SDg0Bn8PUi/+CaVZEzCED+A8rO/dPhOH4nMAM6wjo0evoruB8rBMVEOK+H+Y6i0CGAUFlwQo+lWDST6RkQvKoZ6ZBAwU2RMwjABUdaahbVSUiuVGCSZicsnV21xirBeX3D1ifQS8NfFi5J1bMTupGEy1SsTPw5JAtd7eZKNj0DggZqQkKC7l8sWWmbgyVyqZb9+itl+Sy/0JqEmhWW8LEsiJaotj3lAtq4Yb3wMS6vqaPzCMCE6pVXXqF///vfzhfuUImmGRDqgyEqps4PPfSQUEBEkDNlU+PQSHAxh38/Ruv27q60AyZLr1m9GtXimWasC6LRHzivr9uwOb34YoVBs+yjOjqPAAIIXnZZ9IZ0Mr0EgzsBmGJAkQxMB2vMe++9V7hphTU8lBQV2UNgNfuNwS5YznEFRN/SsBMWDzMg9Kttr/Np/MiHldtW30G2+Vsv1M8bb7xhs9TQZTc9A4J/aITkgD6QdEqN7VTY58j406FrpjtKhvynOhufZrERqh5BEB0vDKi0VTd2tlbIbl2G63VVXXMJAqYYEKyPZ82aJZZe0AmSBPcKMMPwjfgo76tjcAhgBywzq4BqHJf3+ObGVjyMgePBkBJuW1uzdvRXX00Umrq+fVW/3YGAKQYEnR/MdPS+vohdjnuK7COwjBUQs/IaGBYkbcKsuqMwLDhCN5p2Pp0SklJYL+jVCLVAVRtpBExxDjiRgu4PFBFnz54t2oyXAOF64BkRzskU2UNgD/t83r7/N5b/VNb/0ZYqGZDeh0CbLlbOa9VJoOYn9KMPOEwx/CYrch8CpoXQ2M4799xzhf8fOKaCF0Q4l7rkkkuiXtkpFob1TwXECgt4vTbXql6DahjMRPXSx8K1ViedRQu+/VhEV7n++utjocmW2/jxymU0eeN6y/l9Mx44qu98zzddNP82zYAKCwvFjgXcsiKeNWZFbdu2FX9WO4gtZQS9R8QAI1q+fDmtW7eO2rdvTzk5OUbJYv76ChZA165Vh9Iz8vz2JZ52wtDRlIxcKmt7Io0YMVJo2WtNfPwCEUM3oTjq6yLDqebXrRtbQSt9++2XASEuta/qv/QDJAvCtjwUFIO1boYw9YEHHhDyIyMGhIgbkDE1btyYXnjhBYIrh/r1jWcIsk2xeIQFfFZOPeGywl/7E2rGhy6Qto+te55LHz89lMaPHy/UO7T34uEc4grYZUHFwkliR8FsIjWEsEMdq+SXAfXq1UswgECdCzY0M/yT3HXXXYQvg5FZwdq1a4UT/NGjRwsmBQVIBEG88847AzUnJu+vYAF0SbPAoWsSeYdsFxuswiwGS+F4oIIGTQl/r7AwGvpl8UYQVWAGVFjWitKy8x3r3sq5k2jTpk2OlReJgvwyIHhBxEwFhOgX+A2fQG3atBEKiRMmTBA7GMF6RMQXAU7ud3G0B6MtfDApxKWXO2xYgo0bN64SRosWLRLhf+VFaHwazabwrtoxGcHLbjW/ZBRYXujZ0236bR/9duQw5eY38PZX9kl7RB+S2NcLvqN4qIPxxS3bYLUPaAfGwk5+f2W0Pfl8+nLUo4QPD8Zaj9AHtAHLfyskMcBHT28crJQZTJ7WPc6mJh16BZPFb9p1P830ez8WbvplQOXl5aIPGKxTTz1VODiSO15wyQHFROikYKlk9OLrgdCyZUtxeRLHFzMi+JnWzo6gfwSGpSU8UFqZAX5H4sHStknvPFCblv+yU2TL0Tgh0ysH1+ROGOK0BcOAjMqLluuN2/egqWOGi6X2a+y0TI8kAwmEp15e7TXkt1uGtjx1bh0BvwxIFgsbsD179ghZjLwmj1BG1FP/lvetHn1DyEAW5es/BowMfk8kYStX64pSXscRy2/MGqwQHny0x1ceZrYsbX4927klO3ZQclIay9JSDW3rqrMtGPpQizWl4SERXiqzsytctpppBxg1+mAVA9SB2Y+d/DBoRv+NcGzerR/7Ln5fhHnS23BA/SjDqj2czA/s9NoQ6wJdM89BtKUxpQeEWEqY7dx6662CEaETYEoQGj7++OMiTLPTHcvNzSVEZJWE83h9QBCCJ/t4BAzZX39HzIKsvoT+yo30vRbd+wtB7dtvvx3ppqj6w4SAKQaEtowcOVI4oof3w4YNGxK8rvXr10/8Oen0CDIAyJ06depEixcvpg0bNoiv1dixY73xyMKETViqOfrH77RmD7tgDYYBxYF7Vj1wk1IzqFG7nvQ6G0/qzVD08qhrsY2AaQaEGPCwB5s4caLQiB4+fLjYIYOCol3BpBbCIUOGEHR/IPPB1uWgQYNo4MCBIjb9gAEDtEnj4nwNL22P8bLEyAJer5MwSoUgPx7lGK04fM92dn5ntDmhh4e6VoHAvHnzdMPvII7fm2++GZUwmZIByZZDBtOzZ0/xJ6/ZOWKbH39awrJOEnyZIBz0YTZTiNewubCAh4woO6dYdjvgMYm34sF8sAzG8jieKL+kXGzJj+AZ99lnnx1PXQt5XyCiwGYR9PIkdphJXnzxxXT55ZeHvH4rFZieAVkp3Ik8mF3FK/MBPstZtpWZkU81WQvaLMmdsHiUAwGDlieeRbN5tg0lVEXmEQADQow+rCKkbd2TTz4pdpOHDh1qvqAwpox6BhRGLCJSFQTQWaz/EwzV5t0s7ITFKwNq1K4HJbM8aNSoUcHAotIyApjpdOzYke644w4RRAJ+oV9nv11ShSHaQFIMKIIjso+VD7fu3xeU/Ec2F7OgeLGKl32SR/hDatbtDBrNiq/ySy7vqWNgBKCaAqXhCy64gIYNGxbV5kuKAQUez5ClkDHgc4LYAZONEVvxrIwYr4Qt+WNHjylvmxYGGO6Rb7vtNiEfvOKKKyyUEL4sigGFD+sqNS37xZwFfJWMfAGCaOyE6Sk26qWPtWspGTlU2robjeRlWLz2MZRjAuNwRMWIdlIMKIIjJCzg2QFZNdZuDpYwA4JNGJhQvBK25DdxJF6EGVYUnwgE/+THJw5h7xW20bEEy/HjgtVfo2AVD4pXQTT6VtSoNeUUlQolWPxWFH8IKAYUoTHdyBbw8GhnxgBVr4m12Cq8Jv/FMwNCv1t0P5MmT56sHNfrPQR+rl1zzTXCVMpPkqi4pRhQhIYB8h9Qjk4UVLNNQrhmWMXHM5V37C0c12MrWVH8IaAYUITGVMaAT0hMsdwCLMN+i3MGBMf1TTqdyhF5P4hbtQPLD0AcZFQMKEKDuIQ1oP2F4DHTLMyADh85YstFhpl6Ip2mFWtG/8ZLVnjHVBRfCCgGFIHxPHjsKK3ft4c9IJbYqh3eEUHxvgzLyCtid7UdhctWW4CpzFGHQFDGqFHX+hhtEELwYBfMigKitstamzC4R4lngn3YuFfvp6lTp9qKxBJJjBZO/ozWLJ7hWBOOHDroWFmRKkgxoAggv5QF0DVr1OIwzIW2akdUBMiB4n0GBJBKmneijJwCgvuXF1980RZu4c4Mg2r4t/oDiluevY5V365dOyouNu9FwbGKHSxIMSAHwTRbFBhQdm4xO1ivYTaLYTrIgeBiNN4JseSb85b82LGj6L777iOYG8QKwbf5zJmx70A+FHjHlQwIFr/wfez7J4HD/Uj9oQ2ybmhA5+SX8m9cM/f3Zx8qp0/mryuMUrGkk+UbHbVtMErj73qk87fo1peqMdNGSHDfMTbzGz6xQTjqpRc3Q/DPH6ZO3AtBk8NWZFzNgBCyxddxvUQSL7p8AOW1YI54UKzmR14Q2gcFRITgyWMXHPK6uXaAeVZNmVyrIkQNTDK0UUR8U8q6rPYB5dnBQLbHThnJaZkc1uZkeuPNt0RcuWA9cQJ/EBx2KfsyOSKRPcYVA0KIIHgJ1COeIFj2MyxfXqt+iuVLh/Yt3r5NNC+bFRD/EEIBvdZWvYZ3B33ATEdLUhCNaCD+wvTgiw/mY7UPqBMvvJ38qN9fVAxtv/TOwUAQW+v9GROE61Hp9U8vrd41tB8eJDFj1OtHPDu+08MjGq7F1RIsGgAN1IYlHAMsLS2b7CggauuowdMi+Ih2gyAa/RYuW9lt6yilGa19DGL2XDGgMA/dEhZAQ/7jJEEQjbhtbiHYh82cMUMEL3BLn+O1n4oBhXFk97HW8kaO644QzE5SCsuB9v/2m2vkGo3a96TE5FR6g8P3KIptBBQDCuP4LT0egjnX4RkQdsIgGXLLMqwmM9zyzqfRRx+NVvZhYXx+Q1GVYkChQNWgzCW7dlKd2gmUzlEwnCR4RwS5bRm2f/9vNGbMGCehVGWFGQHFgMII+OKdO47r/+jsp9toByJkwC7MTQwoI7eQ6jdtr4TRNp6baMiqGFCYRuEob8HDBszp5ZdsfgrPgvbs3i1/uuLY4oT+tHTJEkJEUEWxiYBiQGEat5XMfBAHPrfA2R0w2fyU2rXpEEeQRRRZt1CDll0pJSOb3nrrLbd0Oe76qRhQmIZ00Y5tVIPNCHJy6oWkRuyEgdy0DKvOio1Nu/ShTz/7zFX9DskDFKFCFQMKE/A/7tjOBqj1CEH3QkF1+GWsxQwOGtFuouZd+9IRnvUhEJ+i2ENAMaAwjBnMJyCAzi1oGNLaUmvXot0uY0CpWXnCWdmbahkW0mcrVIUrBhQqZDXlrt27Rxig5tct01x1/jSVl2H7WCFRz87J+dqip8RmJ5xBK5Yvp7lz50ZPo1RLTCGgGJApmOwl+mnXDi6gWsh2wGTr0mrXEaduW4Y1aN6FUtKz6J133pFQqGOMIKAYUBgGahH0f3IKqTYrIYaSYJSKeGFuY0AQRpd3Pl0Io+M9Tloon59IlK0YUBhQ/3HnTsqr2ygMNRGl8nb8rl0VMcfCUmGUVNKsax86xK5YPv300yhpkWqGGQQUAzKDko00MD7dc/gg5ReGhwGl8zIM/m7cpA+E4UnPqUv1ytvS22+rZZiNxzXsWSPGgHbyrGDChAl+XSqsX7+eZrDbBfm3cuXKsANkt8IfefkFyg/xDphsZ3qdCjmQG2dB0An68ceFtHTpUgmHOkY5AhFhQPPnz6errrqKVqxYQbfddpuhQeFrr71Go0aNEvdhdDhr1qwoh7Nq8xbt3E5ZWXWpTkJy1ZshuAJdINiFgcG7jcradBdhnN977z23dT1m+xsRl6zPPPMMPfLII9SmTRu66KKLaNCgQdS/f38W0lZo80o0MeN54oknqH79+vJSzB0X8AyosHGnsLY7g5dh25gBwf2p9IMc1gZEqLIaNWtTY/YZDTcd99xzT5XnKULNUtX6QSDsDAg6Khs3bqTWrVuLZuXn5ws/vZs2baLS0j/tpOBk/RcOX7xjxw6aMmUK9erVq0oMJNybM2eOt3sNGzakvLw872/fE6svI3w64y/Y/OtY/2fv4UPUvrCJaAoXwWTVEh75KiJfiML8/Mtkp+ub2VXFbjZOzcnJESmlX+tg+6CtxgoG2vw4t1MG8gbK34J1ghZ9P5a+/fZbOueccypVLx3y1+FlKnxkK4o8AmEfhe3btwvn6XiQJCGaA5iNlgGtXr1aCFJnz54tIl0MHTpULNswU5K0hC2hcV3Sww8/LGZU8rf2iPp8Z1ja+2bO5QNsJi3SLGb3q6i37nEBdLVq1fm32dxV02kxq3r3zyupdRKoNm9Ng0EXFlYOfmgXA7v5gWGwOP7Zs4ozf/mLGjangvqN6YMPPhDPi29e/E5LS9O7rK5FAIGwMyA8PIgOoSXMihAqRUvNmjUTsp/MzExxuVGjRjRy5EixVJPpunXrRtOnT5c/hQbwtm0VUSe8F4+fwBzCzs6QXrt96/D9PWfLJsrOKaaatSoEwxWhYCpHtfDNY/QbzKciIIa5/FnMhLZs3kxNmjQRMze0H39H2C2sVcKswY6WNZgXxt53/M22BxhgBhcofxP2ljjx45cIskYtA0ZUDISwhoBerx+YjSsKLwJhF0JnZ2dX2SbG7Ef7oAACLB+0CnWQA4G5aOM54YFGefIPU2vc9/2TkIIJWfmzkv8Yu97ADlh+YWPO/ifTABOx8vdnG8zlz0pMpGP8skMYjT5LstJ/mQdlyHMrR7ttMJu/cfuTqXqNmmIWpPcs+F6Tv2X56hg+BMLOgPAV7dKlC33++eeil5DvYJYjZzpr166lQ4cOCfcKN910k4jzhYf9iy++oJ49ewYthwkflJVrWslGoQeOHqG6RRXyn8p3Q/8rma3uoRkN2ZrbKIEd1pe26kbvvf++27oec/0NOwMCQtdddx2NHj2aBgwYQK+88grdeeedXuCGDBkidIPKysrovPPOo8GDB4t0CxYsoCuvvNKbLtpP5rP/n5r8FQ6VB0Qz/c9NTBIzIDtLTzP1RGOapl1Op/Xr1gkdsmhsn2pTBQJhlwGh2pKSEjE9xjIrIyOj0liMHz/e+xsMZ+DAgQT7nlgTHM7nCKh5rHxYg5lQpCiHl2EIBY1dx/Ly8kg1IyL11i9vT6kZOeI569q1a0TaoCoNjEBEZkCyWb7MR17XHiF0jDXmc+DoUVrGO2B1i5tquxL285q865aTkEgbNmwIKLgNe+NCXGE1fm6adDqVl/pjVeieEGNtp/iIMiA7DY/mvAvZ++Hvnj+YAUV+1lGQnCx2fGDW4jZqyrthBw8eoLFjx7qt6zHTX8WAQjBUc7dvYV2ndMrILAhB6cEVmcBLQMyCoFdlZws+uFqjI3VGXhEVlbWkd5VpRnQMiE4rFAPSAcXupVnbtlLdes3sFuNY/qLUVPqDt+TdaKQJP0FzWJn1559/dgxPVZBzCCgG5ByWoiS4X93F0/6iKGJAtdlAtV5qmhBGQxPdTdSoXQ+qXSeR3ldb8lE57K5gQNAjChfN3rpZhN+pKxQQw1Vr4Hryk5Ipg7WjFy9ebDqEDRT0oCQK3SyYvUCzGPlXrVolzDwCaSQHblXoU9TiPpcxE3qfTTNiob2hRyS6aojcHnEYcQgj/6EZW7cI52PS/CKM3fRbFWzQGmdm0RL2Tw3n7U2bNq2ifY4CYKIAUwVonUOLGkwIJhBQasSu2h8sXN/Jy7m1xy3tCwoKhFpFMgu7o5Was7fEj2dMoK+//pouu+yyaG2mK9vlDgakMYUI5SjvYcv35b/spI5Ne4SyGstl12BGUp6ZTWv27hYzmrVr1rCtWo4w0j3KqgN797L3xj17hLlFImtSF7AiYwabtyQfD3oIlQgwJNBBMKpDB2nH1q20mW3O6tatS7DXgzlMtFFBaXPKrlsiIqgqBhRdo+MKBlQdn/8w0ExefmGxV1zSIgy1WasCTKhReibtTTxMO1hWtY2ZxzFmKjWZuSTyLKc4OUUs1TDj8UcibUoqFXH6bVzO5q3baDvPmho1bkz16oUm+qu/9gS6B2+JX48dQVu2bFGuOAKBFcb7rpABmXVjYRf36Zth/V7EW/CVtbvtlhuK/AjhU8aMqE1OHnXIKxDHJhlZVMAMJRDz0bYH2BawfKl1Ti7BEdpyjs8FH00H2UF8NFF5p95wRiQ8bEZTu9zeFlcwoHAMMrSfYf9Vr0GbcFQXdXVgBtUwPYPAxPbv20c//PBDVBnCJqakU8M2J9Lwl1/xLiOjDkQXNkgxIIcGfda2iqVM/dJWDpUYm8XAKX6r7BzK5NkQ9I5gRBwtCpDlHXvThvXrhC/y2EQ3/lqtGJBDY/r9po3C+XxaurFLWIeqivpiavBuGWZDZfz3K2/jYzYE74yRpjqJFTt1ELgrig4EFANyYBz2s9+fOdu2UP2G7RwoLX6KyGITkJY8G0pkhrRw4UIOmfOjrifC+Omx6kmwCCgGFCxiOukhfMZOUoOytjp33X0JWtjlrH9U/7gm9rRp00wrQrobOXf0XjEgB8b52w3rOBpHCaWkZjtQWnwWAU3sVrxTVo31hxBoALZZ4dRQj09UY79X/pU9Yqx/cPcqXbv6Nh2qQHBKbpWw3ayXf/uB/ez7eTt1OfGCgO5iUYYdlQD0wU5+9N1WWB6b+ZN4p6xldi5t4HDVYEDw+d2uXbuglBeNxsHMuMq+p6SkGD4nZspRaZxDIK4YEMwI9vEWsB7BHMOq8BEPPSJK6EVSGL96pbD9Kilta7i9W8E4angduuu1L9C16tUromJYnTUgP7MvwzYGqh/3tZrQZtL7pqnBDAhYFLMCYxoHFFi9Zzd9//33Ikac0YdDWwbqx5/eOGjTGZ1LLW542NQGPJDpoc2tKLwIqCWYDbz/YK42Yd1aqlfaWlhc2yjKdVmhCAkBdR1mirBNc6PDNNcNuk6HFQPSAcXspbns92fnwf3UuGk3s1lUOg0CiGPfNCub8tjmbMWKFUJvyOoMT1OsOo0hBOJqCRZu3MeuWcVO9fMov25ZuKuOm/qwMCxJSxfmH+s5hBBCMiFsN5YZYE6oAAAX+ElEQVS8iuIfATUDsjjGmzjaxFzW/WnS4iSLJahsWgSwS9Y4I1P4H5rHSzKrch5tmeo8+hFQDMjiGI1ZtZzq1E6kho07WixBZfNFAA7TytmWDBsJMGi1umngW676Hb0IKAZkYWx+YT84X61fy7OfE9m1Q20LJagsRgik8u5YU/ZZdPDAAcGEosWOzKi96ro9BBQDsoDfRyuWUbXqNampWn5ZQC9wlmTW12rK2tOH2aUHdsjUTCgwZrGaQjGgIEduB3+Z/7f2ZzH7qZMQvW5Ig+xW1CVPYo+MMOE4pJhQ1I2Nkw1SDChINN9Yuohq8LKrRetTgsypkgeLgGRCB/cfoPnz5qmZULAAxkB6xYCCGCSEW/6O7b5atj9dKR4GgZudpMliJpRJ0F7GckztjtlBM/ryKgZkckxg7f7sgjlsQ1RA5c27m8ylkjmBAJziYzn2G3bH2JBVMSEnUI2OMhQDMjkOby9ZJIwou5x0EdsjKSU5k7A5lizlOBNC5I55vBxTTMgxaCNakGJAJuBfsH0bvb/sJ2rRpjflsNsNRZFBIJXtx2C6AZ/TmAmpLfrIjIOTtSoGFADNzazx/NjsHyivoCG1ZtmPosgiIPSEmAlhd2zWrFm0f//+yDZI1W4LAcWA/MCHLfe7p0+hanWSqedpf1VLLz9YhfMWdseaZ+Wwf5Vjggkhgqui2ERAMSCDcVu/dw/d8v13tJ9qUO9+11JCYopBSnU5EgjUYWPV5tnZlFyjpoi8sXLlSlu+jiLRB1Un+5iKFAj4ak2YMEEEsvPXBgS6mzhxoohT7i+dk/e+3bCWbpryDR2tlUinnXUDpaYpV6tO4utUWYi+gd2xQg6muG7dOpo5Y4auozGn6lPlOI9ARBjQ/Pnz6aqrrhI+YG677TYaM2aMbs+efvppGjZsGCH91VdfHXKnVat3/0r3TJtM/5k7i/KKm1Gfc4YqP8+6IxNdF4vYwyKWZB4OtwNdIcQiQ4x7RdGPQET8AT3zzDP0yCOPUJs2beiiiy6iQYMGUf/+/ak2GyJKWrt2rXDXOXr0aOGG8/3336d33nmH7rzzTpnEkePuw4doFsd0/2bDelrMvp1TUjLopFOuoJKG7oxw6gioESgE9mMtmAnt5Dj1m9jX9GyeYcP3M9ys5uTkcLhsZTYTgWEJWGXYGRD0NzZu3CicTqF1+fn5lJSUJML4lpaWehsMp+VwTCUdibdv357GjRvnvR/MCerce/gwYTt9F1uyb+eHdCM7Rl+xezdt/m2vKCo3rz5163EJlTZqr4TNwYAbZWlz2Lsi/n7lcd7Bf5AN4U8EFDj4i2jt77//HmWtdm9zws6Atm/fLr5G2ugO6enpwhGVlgFt2bKFcF1SWloa7dq1S/4UR8SY+sc//uG9ds8999A555zj/S1P1jPDW8Y7WtM2b5CXfI7VaOeuzbRz2miawX+K4gwBDkhQQRUnu/nDgw+fosgjEHYGBFebvl8gzFASEhIqoeGbDmkSExMrpalfvz79/e9/914DA4PNkC9h2TZ58mRbuyR2I0IgZBD6bdXnMepHXjv5wfR9sffFyt9vuxhgTNF+GZ3CX11699B+/NnJj4/aySefrPuc4COnKLwIhJ0BZfPWKZTHDvOSqE6dOqK3v3D88MLCwko9z83NFaF85UWk8Q2bUq9evUoMCF82PcW022+/nW6++WbLgkm8OJAhwAzACoH5oD+YwVnV3oU8A5hZ9Y2TmpoqGDhmoFYJoXP0wtmYLS8vL48OsgKhUeikQOVgGYVnRu8jEygv7iM/5EGIU6/3nCgGZAZFZ9OEfRcML2OXLl3o888/Fz2ZMmWKCBIn40JB+AzH5J06daLFixfThg0bhN3P2LFjqXPnzs72XpWmEFAIRBSBsM+A0NvrrruO5PY7pvX33XefF4QhQ4bQ448/LnbIBg8eLHbIsrKyqKSkhAYMGOBNp04UAgqB2EcgIgwIzOSDDz4gLJkyMjIqoTh+/Hjv7zPPPJP69Okjlh5YgihSCCgE4guBiDAgCaEv85HXtUes28UWqvaiOlcIKATiAoGwy4DiAjXVCYWAQsARBBQDcgRGVYhCQCFgBQHFgKygpvIoBBQCjiCgGJAjMKpCFAIKASsIVGPNVK+iupUCoikPlNz0FPWwswYFSDt6RHa0gLHb97///Y9OPfVUgjKeFbJTP+pbuHAhwb7u3HPPtVK9yGO3DZ999plQp2jbtm1E2gAFxK+++orOOOMMoXvm2wiliOiLSOh/R3QXzOnuwVTD11wDdcCKHoatYACRoK1btxJci7Rr144aNWoUiSYIz4GffvopXXnllRGpH5WOGDGC+vXrRz169IhIG2CUinHo2bOnYIQRaYSqtBICaglWCQ71QyGgEAgnAooBhRNtVZdCQCFQCYG4kgFV6pnmx+rVq8XSzNfgVZMkpKcwIsX0H9b6kXKMtW3bNqF5Xl5eHtK++isc7nWhfBopVxgH2CUL5GBYBvt6X/DXbnUvdAi4ggGFDj5VskJAIWAHAbUEs4OeyqsQUAjYQiDmd8EQXQOOyBs0aED+lheY/iNyAly7wieMJCyP5syZIxxdwQWIFbszo7JlHThCPQDtxC4dduSkR0j4toHbES117dpV+zPguZk+BKrHTB/8NSTQOMDDJVytaAkYyL4i8AD6IalJkyYELwjB0rJly8TyCs+DHvnDKlAf9MpT1+whUOMBJntFRC43HtqhQ4cKucLLL78sHrxmzZpVaRC2XrEFDWdgL7zwAnXv3l24e4XeEKJzwDkV3Lt+9913wvpeMocqBelcMCpbmxTb8H/7298E0/npp58IbYWlP3wjoV446YejMLw8+DvttNO02f2em+2Dv3rM9MFfI8yMAyJVwAeU7OO3335LX3/9NV166aXC3xPUAxDJQt6HvCxYWdGaNWvE89CwYUNq3LhxlSb7w8pMH6oUqC7YRwCKiLFKV1xxhYcfbNF8fsk9/FJ7+AtXqTv8UHpY+c7DrkjF9ffee8/z2GOPifNRo0Z5+OXzpmf/Q54ffvjB+zvQib+ytXn/+9//elgHxnvp3nvv9bCDNfGbmZHn9ddf994L9sRsH4zqMdsHf+0yMw7a/OxwznPZZZd5pk6dKi6zgN7DDEibJOhz/sB4/vKXv3iYoXlY6VM3vz+sgu2DbgXqYtAIxKwMyF90DS1b1ouusWTJEpFk1apVYkkm02N5Ju/Ja/6O/srW5oPf6oEDB3ov4UuPrzEIu2PwdfTuu+/S7Nmzg/b5bLYPRvWY7YO38T4nZsdBmw0Kia1atRIzUVxH24qLi+nLL78kaEtjtypYwtIW5WLmYzSDNcLKSh+CbZ9Kr49AzDIgf9E1tF31F10DSyOt+j3OfSNvaMvyPfdXtjYt4p1J2RKWHghLBHMAEF6+GRzRE76O33zzTbr11lu1WQOem+2DUT1m+2DUELPjIPOD+X7yySf017/+VV4SASohg4KvaBwRKw7ymGDo9NNPF+Y2yMOfYd2sRlgF2wfdwtVFSwjErBDaN2oGeo8vma9+h286pJHmGv7umUEz2PyQgbz99tv01FNPiVkP6hg5cqSQYcHO6qyzziJeRggGhRmBGTLbBqN6zOY3aotvfqTTGweZH7Mc2ORp5TvXXHMN4Q/x4UAQFCPd5ZdfLrM5cvRtq3wWfK+jMn99cKQxqhCBQMzOgLTRNeRYGkXXwHVJ2uga2A3zvReMsiIiXfjm943cIet966236MMPP6TnnnvOa4cEoTh25sB8QJgp4cXEl9osmemDv3qC6YNem8yOg8wLo1zf2G2bNm2qtAOGcEuYmTlNRlgF2wen2+Xm8mKWATkRXeOkk04iWMojCgem/NOnTxcGo2YfCH+RO1CeXEbgpfvmm2/opZdeqvTlx7IMsyEswUBLly4VS8BgrMX99QHb3uibv3r89cEMDv7GAXIuMFhJmNmgTS1btpSXxBGRUYYPHy7OIf/BMhWxu5wg7TgYYeWvD060QZVhjEBMa0Lj4UZ0DUyhMYtAdA3oj4AgY5HRNb744gsx85DRNRCXHg8dptkPPvig0MNB/ksuuYQuvPBCY7R07hiVPWzYMPHiQ03gggsuIJhCaIWj559/Pv3zn/8UukGvvPKK0BOCu4g77rjDK5zVqa7KJX990GIAHSSjeoz6UKUygwtG4wD9qoceesgbgglyKASJHD26cvRZxFt74oknaPPmzSJmF9QQEPFWzgwNqtW9fP/99wvdIilj046DP6yM+qBbibroGAIxzYAkCnrRNeQ9eYQiIL7AetE1IPyEXAhMyQr5K9tseRDOQgiuZVJm8yKd2T4Y1eNEH8yMg78+YfaDj4kMWOkvrZ17/rCy2wc77XJj3rhgQG4cONVnhUA8IBCzMqB4AF/1QSHgdgQUA3L7E6D6rxCIIAKKAUUQfFW1QsDtCCgG5PYnQPVfIRBBBBQDiiD4qmqFgNsRsLbvbIAaW33Tr7/+6r0LzV5on/bv35+C0TD2FuDnBMpq0N2AO41FixYJhULoBJkh6J1obcDM5NGm0datvS7PQ4UDQusgrMwtt9wiqwrqiK129gQg7LBKSkp0877//vtCVQHuQqC9jTBCffr00cXYLo66DTh+EUqZMC6FIuHDDz9M9erV85dcKC/K54E9HxB0vdjCXbjB9ZuRb8IQGK5iEbHDKkHb/I8//qhiCmS1PNfkC9p+3k8G9uHi4Qfbc8opp4i/E0880cM2TR7W7fB89NFHfnIGf+vuu+/2oHwQh93xsEmBqULGjRvn6datm6m0Rom0deulCRUOcNthtp967WK/R7DS9EyaNEnvtrgG1yVDhgwR56wQ6GFFSnHui/H111/vYcZgWI7dG2VlZR523OZh41wP6+YELE47JnDJwjpdHtY+D5gPCfgD6UF/rBKb43jYGZ6HDWmtFuHafI7OgMC12c8LPfroo14Gji8DNIFvuOEGcfTecPBkwIABhD8zBO+DcEAWaooEDk70CZbqeuSL8cyZM4XhrF5au9dgwoFAAjBhkRrNwZSJmTdme+EiKC/Cil9R8AiEXAaEhwFmBzBFgJElPPPBRAKGmWeffbY4otmYzt9zzz3Ut29f4TsHtlNagt8a/sqJ5dyTTz5JmGZLwssAkwctYfkAHzyYhn/88cfC7GLy5MniHO4wYH0tl4vw1offcOmAcmASoCV/dWvT+Ts3iwNwgksOtAXtnzBhQpVi0Q+4rIDZCM8sK92HtjfwwT0snW688cZK9lhIDPcT/MUXLzdMUaRvItyDx0hY7PuSFuP//Oc/wqYLvnv+7//+j1577TUR8E+bZ/369cQO3sS4aq/Lc9jdwQsizC5gkrJhwwZxC/l4BibOYR8G41098jcmMLnAeMK7IsgMJlg+wTMlGB78N/kyFKNnBB8zmJeA8PxiiQwK9DzDAyPEB7179xZtnTVrlsjntn8hZ0AAFK4VEI4GltcrVqwQDyuYCdbdePgxiB06dBByHLijgEkE5EZgIiBYnCOqKWQvkE2MGTOGIGeRBEdTMi2uwR4ILx4s0zt27CjsivBiQZ4BNxdw+wCXEGAKKJOXZASfyXhp8aLBZ7NkQoHqlm0wcwyEAxginKLhyw/mjJcCLjpgxCoJaS6++GJq06aNwBNMSvuSgulAjoMHGy8T+sdLYlGWLAPuYWGSgZf/1VdfFUxf3ps4cSKxp0L503vUYty0aVMxnkVFRdS8eXMhM7rrrrsqMZs33niD8NLqydrYGyTBMBRtwMcJHyU4KANTwdgAAxDc60rbPm9D+CTQmAA3MEVY2YPMYMLLW+GPCc8fmA+MdNFnkL9nBM8qxgKEPhQUFAR8nvGR6dWrl5AXgVHC/AZugiXDFIW55Z+Ti0/IPiCXYaNQ8Xfdddd5+CEScgc2NhRVsV8a8ZuNI71Vw0UqM6hKa31cY9cUHn6YPPxl8fDginOZqUuXLl4ZEH+xPWxoKm4x4xDl8yxBJhXyJ15CiPxoB2QLkjhcsnDZKn/jiGtSJhCobm0+eW4VB8g7UlNTK7mVxTV+iT1sJyVct/Jz6WELflmV51//+peH3Ul4+KvvYYGth5moh706eu8zMxN48OzTI2VAzIC899kSX9znL7e4xozPwzMAca6VAWkxxk1m7F4ZEH9EPPwx8WBsJbFnQg8zffmz0pEdxnvY10+Va3CnCmLGJNrEs6RKaeSPQGMCGRBwYp/TATFBmZABof28bJNVeNgliAcuekGBnhFmnKI+KQMK9DyjXZBRMSMS5eMZZ68IlcZN3HDBP8dlQFjeYHoNwtcMMxd8ofFFlgRjQ63LCUw/8eXAdF4Svl74UqA8fEnxxdAaamKp5rtMQ15MbVE+vrCSIIPCny9hao6dJcyUYIUuCQaRsOQGBVO3zI+jFRzmzZsn8MLMTBJmQLDolksCYAosJGEWgyURdoDgjB1LW7QZX3TkgasLEGaazNzEuXa3BzNEzERhLY+xskJwAgfn8li6YVnBfrUJSyl4F/AlzODWsksO7MZpCTNbveWmNo08D2ZM4OvHHyayTMySMJuRBCzwDJh5RmQeeQz0PPPHk1jILtzHYqmNmSpEBWir2+hPxB3qOYSVWiG0XrF44LWuFvBQ4sXSXsO2K9bWuAYhn1bmgzKli1Pf8sG0YNmuZVa+aeRvrNMxXYeFvLZuvNSZmZkiWTB1y3JxtIIDliS+UT2k50DZf6g1aL0+YlkJwosC3z9w9oUPwAknnCCm9RCGyw+CSMj/tFvaYLZ48JHfDoHxIMQOPhxYDoNx6oXVAZ4gLN+0hH7KPmqv650HMyZWMEGdaA8wMfOM+LYx0POM5w1MCgybd2WJVwp00003icgtTvlB8m1TtP52nAFZ6ShC5UL2AN0NyQiwCwLZAORGUi6iLVtv9oP7+LLgAYWgVb6cmBVBLgTZiJYxoWzIKKCjpP0ioy2SwQVTt7Z9Vs6BA+REWsJvfJnhxAs7eJhZ4AGXDBJCTzARXvaJBxi4QJYimQzCEYHAaCVh1gcZGIijYogdJ70wNjK9mSNkJmCe8PWDnTTo8OgRvB1ihod+9ejRw5sEsx/trNh7Q+ckmDFB/81gglmVlvAMQP5k5hmRzxSvmEQRgZ5nyEERgACMB39gcpgJPf/88445YtP2JZrPq0dD47DrgCULdmTwcsEdJ77ccJSFhxXTe7x4zz77rFhKYEoN5qRH+PJDMHrttdeKFxFOvjgMjniQMMvCVxnl4yHAbgl2XPDFhr9mfIGxZIEgUnozDKZuvfYEcw1thuATSy74rEFbEEMMAmmtjxwo5mGbGUsdvOiDBg0SsyIsY9EHzAJBWJZB2A/CTEASHnTsSOIPOzcQzKPPwRBmTVAW1LpOxSwIO5x4IbGk0SMwS+yO4esPYTuWhhCEwyskNgHMUDBjYhYTCN7BdIAr2oPlMHYKQYGeETnTwzIWs9hAzzPK/Cs75QezxniBAeG5x8fTdeSknAvCV94N8VskBJUQLvsSa6N6eMbi4RdNCF3PO+88DwSnkqAIB6VGZkge/rp7+KXTFUIjPb8YQkjKD7snPT3dw7IIDzM4URQzHg8/lEJoiBhgEO5C4MwzHg8v3TwQkCJul5b81a1NJ8/t4MAMxcOzG4EDBPMQnkPIC4IiIhTe+AX0MDP18Ivu4e14Dz/AsmrP1VdfLfBDH4ETz/qEgBVCZCmE5qWtEPoDS/7Ke/hl8+Y3K4TmnTkxFhgTSRgvCFdZU1te0j0yc/VAEI7xwXijDJQnKZAQGun8jQkvnbxCaKT1hwnuQwjNu4kenrmIZwDYMpPGLUFmnhGWSYo6b775ZpEn0PPMW/5iLDHGwIx3A4Xw/XiVrjkghElUERgFHiAjwn3sGpgh7ArhYdcj/uJUuswKkx7WRal0zfdHMHX75g3mN/rHMz4P2mREHD6o0q6hNh3wY1mM9lKVc6SRTLnKTZMXUAaYmiTs6oCp4QNghnhWFhDzQOWYHRMzmKAuPAPa3TBt/YGeEXwIsBupJbQPdRsRzyC9HxijNPF8XXlEdN2c1/kOYwkBHRbsdmJZJ5XxnK9JlRhvCESFEDreQHVbfyAvww6YFL66rf+qv9YRUDMg69ipnBoEIOTWqgdobqlThYAhAooBGUKjbigEFAKhRiAqtuFD3UlVvkJAIRCdCCgGFJ3jolqlEHAFAooBuWKYVScVAtGJgGJA0TkuqlUKAVcgoBiQK4ZZdVIhEJ0I/D+mUpmEI7A6CAAAAABJRU5ErkJggg==" /><!-- --></p>
 </div>
@@ -453,44 +453,44 @@ <h1>Prediction</h1>
 <h1>A Regression Example</h1>
 <p>All the examples above have been classification tasks, predicting a yes/no outcome. Here’s an example of a full regression modeling pipeline on a silly problem: predicting individuals’ ages. The code is very similar to classification.</p>
 <div class="sourceCode" id="cb15"><pre class="sourceCode r"><code class="sourceCode r"><a class="sourceLine" id="cb15-1" data-line-number="1">regression_models &lt;-<span class="st"> </span><span class="kw">machine_learn</span>(pima_diabetes, patient_id, <span class="dt">outcome =</span> age)</a>
-<a class="sourceLine" id="cb15-2" data-line-number="2"><span class="co">#&gt;  Training new data prep recipe</span></a>
-<a class="sourceLine" id="cb15-3" data-line-number="3"><span class="co">#&gt;  Variable(s) ignored in prep_data won't be used to tune models: patient_id</span></a>
-<a class="sourceLine" id="cb15-4" data-line-number="4"><span class="co">#&gt;  age looks numeric, so training regression algorithms.</span></a>
-<a class="sourceLine" id="cb15-5" data-line-number="5"><span class="co">#&gt;  Running cross validation for Random Forest</span></a>
-<a class="sourceLine" id="cb15-6" data-line-number="6"><span class="co">#&gt;  Running cross validation for k-Nearest Neighbors</span></a>
+<a class="sourceLine" id="cb15-2" data-line-number="2"><span class="co"># &gt; Training new data prep recipe</span></a>
+<a class="sourceLine" id="cb15-3" data-line-number="3"><span class="co"># &gt; Variable(s) ignored in prep_data won't be used to tune models: patient_id</span></a>
+<a class="sourceLine" id="cb15-4" data-line-number="4"><span class="co"># &gt; age looks numeric, so training regression algorithms.</span></a>
+<a class="sourceLine" id="cb15-5" data-line-number="5"><span class="co"># &gt; Running cross validation for Random Forest</span></a>
+<a class="sourceLine" id="cb15-6" data-line-number="6"><span class="co"># &gt; Running cross validation for k-Nearest Neighbors</span></a>
 <a class="sourceLine" id="cb15-7" data-line-number="7"><span class="kw">summary</span>(regression_models)</a>
-<a class="sourceLine" id="cb15-8" data-line-number="8"><span class="co">#&gt;  Models trained: 2018-04-02 05:58:45</span></a>
-<a class="sourceLine" id="cb15-9" data-line-number="9"><span class="co">#&gt;  </span></a>
-<a class="sourceLine" id="cb15-10" data-line-number="10"><span class="co">#&gt;  Models tuned via 5-fold cross validation over 10 combinations of hyperparameter values.</span></a>
-<a class="sourceLine" id="cb15-11" data-line-number="11"><span class="co">#&gt;  Best performance: RMSE = 9.07</span></a>
-<a class="sourceLine" id="cb15-12" data-line-number="12"><span class="co">#&gt;  By Random Forest with hyperparameters:</span></a>
-<a class="sourceLine" id="cb15-13" data-line-number="13"><span class="co">#&gt;    mtry = 10</span></a>
-<a class="sourceLine" id="cb15-14" data-line-number="14"><span class="co">#&gt;    splitrule = extratrees</span></a>
-<a class="sourceLine" id="cb15-15" data-line-number="15"><span class="co">#&gt;    min.node.size = 10</span></a>
-<a class="sourceLine" id="cb15-16" data-line-number="16"><span class="co">#&gt;  </span></a>
-<a class="sourceLine" id="cb15-17" data-line-number="17"><span class="co">#&gt;  Out-of-fold performance of all trained models:</span></a>
-<a class="sourceLine" id="cb15-18" data-line-number="18"><span class="co">#&gt;  </span></a>
-<a class="sourceLine" id="cb15-19" data-line-number="19"><span class="co">#&gt;  $`Random Forest`</span></a>
-<a class="sourceLine" id="cb15-20" data-line-number="20"><span class="co">#&gt;  # A tibble: 10 x 9</span></a>
-<a class="sourceLine" id="cb15-21" data-line-number="21"><span class="co">#&gt;    min.node.size  mtry splitrule   RMSE Rsquared   MAE RMSESD RsquaredSD</span></a>
-<a class="sourceLine" id="cb15-22" data-line-number="22"><span class="co">#&gt;  *         &lt;int&gt; &lt;int&gt; &lt;fct&gt;      &lt;dbl&gt;    &lt;dbl&gt; &lt;dbl&gt;  &lt;dbl&gt;      &lt;dbl&gt;</span></a>
-<a class="sourceLine" id="cb15-23" data-line-number="23"><span class="co">#&gt;  1            10    10 extratrees  9.07    0.404  6.43  0.640     0.0358</span></a>
-<a class="sourceLine" id="cb15-24" data-line-number="24"><span class="co">#&gt;  2             8    11 extratrees  9.09    0.402  6.43  0.626     0.0396</span></a>
-<a class="sourceLine" id="cb15-25" data-line-number="25"><span class="co">#&gt;  3            12     5 extratrees  9.13    0.405  6.56  0.666     0.0272</span></a>
-<a class="sourceLine" id="cb15-26" data-line-number="26"><span class="co">#&gt;  4            10    13 variance    9.33    0.376  6.60  0.633     0.0358</span></a>
-<a class="sourceLine" id="cb15-27" data-line-number="27"><span class="co">#&gt;  5             7    10 variance    9.34    0.374  6.61  0.583     0.0303</span></a>
-<a class="sourceLine" id="cb15-28" data-line-number="28"><span class="co">#&gt;  # ... with 5 more rows, and 1 more variable: MAESD &lt;dbl&gt;</span></a>
-<a class="sourceLine" id="cb15-29" data-line-number="29"><span class="co">#&gt;  </span></a>
-<a class="sourceLine" id="cb15-30" data-line-number="30"><span class="co">#&gt;  $`k-Nearest Neighbors`</span></a>
-<a class="sourceLine" id="cb15-31" data-line-number="31"><span class="co">#&gt;  # A tibble: 10 x 9</span></a>
-<a class="sourceLine" id="cb15-32" data-line-number="32"><span class="co">#&gt;     kmax distance kernel       RMSE Rsquared   MAE RMSESD RsquaredSD MAESD</span></a>
-<a class="sourceLine" id="cb15-33" data-line-number="33"><span class="co">#&gt;  * &lt;dbl&gt;    &lt;dbl&gt; &lt;fct&gt;       &lt;dbl&gt;    &lt;dbl&gt; &lt;dbl&gt;  &lt;dbl&gt;      &lt;dbl&gt; &lt;dbl&gt;</span></a>
-<a class="sourceLine" id="cb15-34" data-line-number="34"><span class="co">#&gt;  1   16.    2.60  inv          9.44    0.363  6.65  0.811     0.0649 0.551</span></a>
-<a class="sourceLine" id="cb15-35" data-line-number="35"><span class="co">#&gt;  2   14.    1.73  gaussian     9.44    0.361  6.66  0.717     0.0593 0.452</span></a>
-<a class="sourceLine" id="cb15-36" data-line-number="36"><span class="co">#&gt;  3   13.    1.58  triangular   9.49    0.355  6.66  0.764     0.0697 0.461</span></a>
-<a class="sourceLine" id="cb15-37" data-line-number="37"><span class="co">#&gt;  4   10.    0.933 rectangular  9.55    0.346  6.79  0.637     0.0438 0.412</span></a>
-<a class="sourceLine" id="cb15-38" data-line-number="38"><span class="co">#&gt;  5    6.    1.68  inv          9.64    0.340  6.74  0.723     0.0677 0.465</span></a>
-<a class="sourceLine" id="cb15-39" data-line-number="39"><span class="co">#&gt;  # ... with 5 more rows</span></a></code></pre></div>
+<a class="sourceLine" id="cb15-8" data-line-number="8"><span class="co"># &gt; Models trained: 2018-04-02 16:19:14</span></a>
+<a class="sourceLine" id="cb15-9" data-line-number="9"><span class="co"># &gt; </span></a>
+<a class="sourceLine" id="cb15-10" data-line-number="10"><span class="co"># &gt; Models tuned via 5-fold cross validation over 10 combinations of hyperparameter values.</span></a>
+<a class="sourceLine" id="cb15-11" data-line-number="11"><span class="co"># &gt; Best performance: RMSE = 9.07</span></a>
+<a class="sourceLine" id="cb15-12" data-line-number="12"><span class="co"># &gt; By Random Forest with hyperparameters:</span></a>
+<a class="sourceLine" id="cb15-13" data-line-number="13"><span class="co"># &gt;   mtry = 10</span></a>
+<a class="sourceLine" id="cb15-14" data-line-number="14"><span class="co"># &gt;   splitrule = extratrees</span></a>
+<a class="sourceLine" id="cb15-15" data-line-number="15"><span class="co"># &gt;   min.node.size = 10</span></a>
+<a class="sourceLine" id="cb15-16" data-line-number="16"><span class="co"># &gt; </span></a>
+<a class="sourceLine" id="cb15-17" data-line-number="17"><span class="co"># &gt; Out-of-fold performance of all trained models:</span></a>
+<a class="sourceLine" id="cb15-18" data-line-number="18"><span class="co"># &gt; </span></a>
+<a class="sourceLine" id="cb15-19" data-line-number="19"><span class="co"># &gt; $`Random Forest`</span></a>
+<a class="sourceLine" id="cb15-20" data-line-number="20"><span class="co"># &gt; # A tibble: 10 x 9</span></a>
+<a class="sourceLine" id="cb15-21" data-line-number="21"><span class="co"># &gt;   min.node.size  mtry splitrule   RMSE Rsquared   MAE RMSESD RsquaredSD</span></a>
+<a class="sourceLine" id="cb15-22" data-line-number="22"><span class="co"># &gt; *         &lt;int&gt; &lt;int&gt; &lt;fct&gt;      &lt;dbl&gt;    &lt;dbl&gt; &lt;dbl&gt;  &lt;dbl&gt;      &lt;dbl&gt;</span></a>
+<a class="sourceLine" id="cb15-23" data-line-number="23"><span class="co"># &gt; 1            10    10 extratrees  9.07    0.404  6.43  0.640     0.0358</span></a>
+<a class="sourceLine" id="cb15-24" data-line-number="24"><span class="co"># &gt; 2             8    11 extratrees  9.09    0.402  6.43  0.626     0.0396</span></a>
+<a class="sourceLine" id="cb15-25" data-line-number="25"><span class="co"># &gt; 3            12     5 extratrees  9.13    0.405  6.56  0.666     0.0272</span></a>
+<a class="sourceLine" id="cb15-26" data-line-number="26"><span class="co"># &gt; 4            10    13 variance    9.33    0.376  6.60  0.633     0.0358</span></a>
+<a class="sourceLine" id="cb15-27" data-line-number="27"><span class="co"># &gt; 5             7    10 variance    9.34    0.374  6.61  0.583     0.0303</span></a>
+<a class="sourceLine" id="cb15-28" data-line-number="28"><span class="co"># &gt; # ... with 5 more rows, and 1 more variable: MAESD &lt;dbl&gt;</span></a>
+<a class="sourceLine" id="cb15-29" data-line-number="29"><span class="co"># &gt; </span></a>
+<a class="sourceLine" id="cb15-30" data-line-number="30"><span class="co"># &gt; $`k-Nearest Neighbors`</span></a>
+<a class="sourceLine" id="cb15-31" data-line-number="31"><span class="co"># &gt; # A tibble: 10 x 9</span></a>
+<a class="sourceLine" id="cb15-32" data-line-number="32"><span class="co"># &gt;    kmax distance kernel       RMSE Rsquared   MAE RMSESD RsquaredSD MAESD</span></a>
+<a class="sourceLine" id="cb15-33" data-line-number="33"><span class="co"># &gt; * &lt;dbl&gt;    &lt;dbl&gt; &lt;fct&gt;       &lt;dbl&gt;    &lt;dbl&gt; &lt;dbl&gt;  &lt;dbl&gt;      &lt;dbl&gt; &lt;dbl&gt;</span></a>
+<a class="sourceLine" id="cb15-34" data-line-number="34"><span class="co"># &gt; 1   16.    2.60  inv          9.44    0.363  6.65  0.811     0.0649 0.551</span></a>
+<a class="sourceLine" id="cb15-35" data-line-number="35"><span class="co"># &gt; 2   14.    1.73  gaussian     9.44    0.361  6.66  0.717     0.0593 0.452</span></a>
+<a class="sourceLine" id="cb15-36" data-line-number="36"><span class="co"># &gt; 3   13.    1.58  triangular   9.49    0.355  6.66  0.764     0.0697 0.461</span></a>
+<a class="sourceLine" id="cb15-37" data-line-number="37"><span class="co"># &gt; 4   10.    0.933 rectangular  9.55    0.346  6.79  0.637     0.0438 0.412</span></a>
+<a class="sourceLine" id="cb15-38" data-line-number="38"><span class="co"># &gt; 5    6.    1.68  inv          9.64    0.340  6.74  0.723     0.0677 0.465</span></a>
+<a class="sourceLine" id="cb15-39" data-line-number="39"><span class="co"># &gt; # ... with 5 more rows</span></a></code></pre></div>
 <p>Let’s make a prediction on a hypothetical new patient. Note that the model handles missingness in <code>insulin</code> and a new category level in <code>weight_class</code> without a problem (but warns about it).</p>
 <div class="sourceCode" id="cb16"><pre class="sourceCode r"><code class="sourceCode r"><a class="sourceLine" id="cb16-1" data-line-number="1">new_patient &lt;-<span class="st"> </span><span class="kw">data.frame</span>(</a>
 <a class="sourceLine" id="cb16-2" data-line-number="2">  <span class="dt">pregnancies =</span> <span class="dv">0</span>,</a>
@@ -502,17 +502,17 @@ <h1>A Regression Example</h1>
 <a class="sourceLine" id="cb16-8" data-line-number="8">  <span class="dt">pedigree =</span> <span class="fl">.2</span>,</a>
 <a class="sourceLine" id="cb16-9" data-line-number="9">  <span class="dt">diabetes =</span> <span class="st">&quot;N&quot;</span>)</a>
 <a class="sourceLine" id="cb16-10" data-line-number="10"><span class="kw">predict</span>(regression_models, new_patient)</a>
-<a class="sourceLine" id="cb16-11" data-line-number="11"><span class="co">#&gt;  Warning in ready_with_prep(object, newdata, mi): The following variables(s) had the following value(s) in predict that were not observed in training. </span></a>
-<a class="sourceLine" id="cb16-12" data-line-number="12"><span class="co">#&gt;      weight_class: ???</span></a>
-<a class="sourceLine" id="cb16-13" data-line-number="13"><span class="co">#&gt;  Prepping data based on provided recipe</span></a>
-<a class="sourceLine" id="cb16-14" data-line-number="14"><span class="co">#&gt;  &quot;predicted_age&quot; predicted by Random Forest last trained: 2018-04-02 05:58:45</span></a>
-<a class="sourceLine" id="cb16-15" data-line-number="15"><span class="co">#&gt;  Performance in training: RMSE = 9.07</span></a>
-<a class="sourceLine" id="cb16-16" data-line-number="16"><span class="co">#&gt;  # A tibble: 1 x 9</span></a>
-<a class="sourceLine" id="cb16-17" data-line-number="17"><span class="co">#&gt;    predicted_age pregnancies plasma_glucose diastolic_bp skinfold insulin</span></a>
-<a class="sourceLine" id="cb16-18" data-line-number="18"><span class="co">#&gt;  *         &lt;dbl&gt;       &lt;dbl&gt;          &lt;dbl&gt;        &lt;dbl&gt;    &lt;dbl&gt; &lt;lgl&gt;  </span></a>
-<a class="sourceLine" id="cb16-19" data-line-number="19"><span class="co">#&gt;  1          23.9          0.            80.          55.      24. NA     </span></a>
-<a class="sourceLine" id="cb16-20" data-line-number="20"><span class="co">#&gt;  # ... with 3 more variables: weight_class &lt;fct&gt;, pedigree &lt;dbl&gt;,</span></a>
-<a class="sourceLine" id="cb16-21" data-line-number="21"><span class="co">#&gt;  #   diabetes &lt;fct&gt;</span></a></code></pre></div>
+<a class="sourceLine" id="cb16-11" data-line-number="11"><span class="co"># &gt; Warning in ready_with_prep(object, newdata, mi): The following variables(s) had the following value(s) in predict that were not observed in training. </span></a>
+<a class="sourceLine" id="cb16-12" data-line-number="12"><span class="co"># &gt;     weight_class: ???</span></a>
+<a class="sourceLine" id="cb16-13" data-line-number="13"><span class="co"># &gt; Prepping data based on provided recipe</span></a>
+<a class="sourceLine" id="cb16-14" data-line-number="14"><span class="co"># &gt; &quot;predicted_age&quot; predicted by Random Forest last trained: 2018-04-02 16:19:14</span></a>
+<a class="sourceLine" id="cb16-15" data-line-number="15"><span class="co"># &gt; Performance in training: RMSE = 9.07</span></a>
+<a class="sourceLine" id="cb16-16" data-line-number="16"><span class="co"># &gt; # A tibble: 1 x 9</span></a>
+<a class="sourceLine" id="cb16-17" data-line-number="17"><span class="co"># &gt;   predicted_age pregnancies plasma_glucose diastolic_bp skinfold insulin</span></a>
+<a class="sourceLine" id="cb16-18" data-line-number="18"><span class="co"># &gt; *         &lt;dbl&gt;       &lt;dbl&gt;          &lt;dbl&gt;        &lt;dbl&gt;    &lt;dbl&gt; &lt;lgl&gt;  </span></a>
+<a class="sourceLine" id="cb16-19" data-line-number="19"><span class="co"># &gt; 1          23.9          0.            80.          55.      24. NA     </span></a>
+<a class="sourceLine" id="cb16-20" data-line-number="20"><span class="co"># &gt; # ... with 3 more variables: weight_class &lt;fct&gt;, pedigree &lt;dbl&gt;,</span></a>
+<a class="sourceLine" id="cb16-21" data-line-number="21"><span class="co"># &gt; #   diabetes &lt;fct&gt;</span></a></code></pre></div>
 </div>