Update README.md

Jaan Altosaar · web-flow · commit 54bf13e99215 · 2019-01-20T16:14:03.000-05:00
diff --git a/README.md b/README.md
@@ -1,16 +1,16 @@
 # Variational Autoencoder / Deep Latent Gaussian Model in tensorflow and pytorch
 Reference implementation for a variational autoencoder in TensorFlow and PyTorch.
 
-I recommend the PyTorch version.
+I recommend the PyTorch version. It includes an example of a more expressive variational family (the [inverse autoregressive flow](https://arxiv.org/abs/1606.04934).
 
-Mean-field variational inference is used to fit the model to binarized MNIST handwritten digits images. An inference network (encoder) is used to amortize the inference and share parameters across datapoints. The likelihood is parameterized by a generative network (decoder).
+Variational inference is used to fit the model to binarized MNIST handwritten digits images. An inference network (encoder) is used to amortize the inference and share parameters across datapoints. The likelihood is parameterized by a generative network (decoder).
 
 Blog post: https://jaan.io/what-is-variational-autoencoder-vae-tutorial/
 
 Example output with importance sampling for estimating the marginal likelihood on Hugo Larochelle's Binary MNIST dataset. Finaly marginal likelihood on the test set of `-97.10` nats.
 
 ```
-$ python train_variational_autoencoder_pytorch.py
+$ python train_variational_autoencoder_pytorch.py --variational mean-field
 step:   0       train elbo: -558.69
 step:   0               valid elbo: -391.84     valid log p(x): -363.25
 step:   5000    train elbo: -116.09
@@ -41,3 +41,43 @@ step:   65000   train elbo: -96.19
 step:   65000           valid elbo: -104.46     valid log p(x): -97.43
 step:   65000           test elbo: -103.31      test log p(x): -97.10
 ```
+
+
+Using a non mean-field, more expressive variational posterior approximation, the test marginal log-likelihood improves to `-95.33` nats:
+
+```
+$ python train_variational_autoencoder_pytorch.py --variational flow
+step:   0       train elbo: -578.35
+step:   0               valid elbo: -407.06     valid log p(x): -367.88
+step:   10000   train elbo: -106.63
+step:   10000           valid elbo: -110.12     valid log p(x): -104.00
+step:   20000   train elbo: -101.51
+step:   20000           valid elbo: -105.02     valid log p(x): -99.11
+step:   30000   train elbo: -98.70
+step:   30000           valid elbo: -103.76     valid log p(x): -97.71
+step:   40000   train elbo: -104.31
+step:   40000           valid elbo: -103.71     valid log p(x): -97.27
+step:   50000   train elbo: -97.20
+step:   50000           valid elbo: -102.97     valid log p(x): -96.60
+step:   60000   train elbo: -97.50
+step:   60000           valid elbo: -102.82     valid log p(x): -96.49
+step:   70000   train elbo: -94.68
+step:   70000           valid elbo: -102.63     valid log p(x): -96.22
+step:   80000   train elbo: -92.86
+step:   80000           valid elbo: -102.53     valid log p(x): -96.09
+step:   90000   train elbo: -93.83
+step:   90000           valid elbo: -102.33     valid log p(x): -96.00
+step:   100000  train elbo: -93.91
+step:   100000          valid elbo: -102.48     valid log p(x): -95.92
+step:   110000  train elbo: -94.34
+step:   110000          valid elbo: -102.81     valid log p(x): -96.09
+step:   120000  train elbo: -88.63
+step:   120000          valid elbo: -102.53     valid log p(x): -95.80
+step:   130000  train elbo: -96.61
+step:   130000          valid elbo: -103.56     valid log p(x): -96.26
+step:   140000  train elbo: -94.92
+step:   140000          valid elbo: -102.81     valid log p(x): -95.86
+step:   150000  train elbo: -97.84
+step:   150000          valid elbo: -103.06     valid log p(x): -95.92
+step:   150000          test elbo: -101.64      test log p(x): -95.33
+```