Skip to content

Commit 5dee052

Browse files
xadupresdpython
andauthored
Quantization second part (#43)
* Quantization second part * Update quantization_f8.ipynb * nb * fix link * urls --------- Co-authored-by: Xavier Dupré <xavier.dupre@gmail.com>
1 parent 179c605 commit 5dee052

File tree

4 files changed

+211
-30
lines changed

4 files changed

+211
-30
lines changed

.github/workflows/check_urls.yml

+12-1
Original file line numberDiff line numberDiff line change
@@ -1,8 +1,19 @@
11
name: Check URLs
22

33
on:
4+
pull_request:
5+
branches: [main]
46
schedule:
5-
- cron: '0 0 0 * *'
7+
# ┌───────────── minute (0 - 59)
8+
# │ ┌───────────── hour (0 - 23)
9+
# │ │ ┌───────────── day of the month (1 - 31)
10+
# │ │ │ ┌───────────── month (1 - 12 or JAN-DEC)
11+
# │ │ │ │ ┌───────────── day of the week (0 - 6 or SUN-SAT)
12+
# │ │ │ │ │
13+
# │ │ │ │ │
14+
# │ │ │ │ │
15+
# * * * * *
16+
- cron: '30 1 * * 0'
617

718
jobs:
819
build:

.github/workflows/documentation.yml

+7-1
Original file line numberDiff line numberDiff line change
@@ -1,6 +1,12 @@
11
name: Documentation and Code Coverage
22

3-
on: [push]
3+
on:
4+
push:
5+
pull_request:
6+
types:
7+
- closed
8+
branches:
9+
- main
410

511
jobs:
612
run:

_doc/c_garden/quantization.rst

+12-3
Original file line numberDiff line numberDiff line change
@@ -17,9 +17,9 @@ et nécessitent de plus en plus de puissance de calcul. La
1717
la mémoire nécessaire pour stocker les coefficients et le
1818
temps de calcul avec les dernières cartes graphiques.
1919
La quantization est équivalent à une discrétisation.
20-
Voir aussi :
21-
`A Survey of Quantization Methods for Efficient
22-
Neural Network Inference <https://arxiv.org/pdf/2103.13630.pdf>`_.
20+
Voir aussi [Gholami2021]_ et quelques bout de codes
21+
`quantization.py
22+
<https://github.com/apache/mxnet/blob/master/python/mxnet/contrib/quantization.py>`_.
2323

2424
Les produits matriciels sont fréquents dans les réseaux de neurones où
2525
on multiple les entrées *X* d'une couche de neurones avec les coefficients
@@ -195,3 +195,12 @@ Notebooks
195195
:maxdepth: 1
196196

197197
../notebooks/dsgarden/quantization_f8
198+
199+
Bibliographie
200+
=============
201+
202+
.. [Gholami2021] Amir Gholami, Sehoon Kim, Zhen Dong, Zhewei Yao, Michael W. Mahoney, Kurt Keutzer,
203+
University of California, Berkeley
204+
`A Survey of Quantization Methods for Efficient
205+
Neural Network Inference <https://arxiv.org/pdf/2103.13630.pdf>`_
206+

_doc/notebooks/dsgarden/quantization_f8.ipynb

+180-25
Large diffs are not rendered by default.

0 commit comments

Comments
 (0)