Juin 2020#
Julia est dans sa version 1.4.2 depuis quelques jours. La version 1.5 est en route avec quelques nouveautés. Des nouvelles très « data science » ce mois-ci.
Billets de blog#
Deploying Julia projects on Heroku.com: Article en ligne sur le déploiement d’une application Julia sur le service Heroku. Les tableaux de bord déployés sur ce service sont souvent liés à l’analyse et la visualisation de données.
Understanding package version restrictions in Julia: Article pour comprendre ce qui se cache dans les fichiers
Project.toml
etManifest.toml
.
Vidéo#
Une interview de deux des créateurs de Julia: Jeff Bezancon et Viral B Shah
Une série de vidéos assez courtes sur des exemples d’utilisation de Julia en apprentissage statistique. Voici le lien vers les notebooks:
GPU Programming in Julia: Webinaire très intéressant sur la programmation CUDA en Julia. Attention, le package
CuArrays.jl
présenté dans la vidéo a été remplacé il y a quelques jours par le package CUDA.jl. La documentation a beaucoup progressé. La facilité avec laquelle on peut porter des applications sur GPU est une grande force du langage.
Packages#
ParallelKMeans.jl : Implémentation julia de la méthode bien connue, mais parfois décevante d’apprentissage non supervisée. L’algorithme n’est pas très compliqué, mais ce qui est intéressant dans ce package c’est la gestion du parallélisme avec des threads. Selon les benchmarks, les performances sont impressionnantes.
OptimalTransport.jl : Version Julia de l’excellent package Python POT dont beaucoup de développeurs sont francais. Attention ce package n’a que quelques semaines, ce n’est que le début d’une bonne initiative.
SystemBenchmark.jl: Si vous voulez comparer les performances de votre dernier portable avec le vieux serveur de calcul du labo, c’est le package qu’il vous faut.
UrlDownload.jl : Package utile pour télécharger des fichiers avec une barre de progression et il peut éventuellement convertir le résultat vers le bon format (DataFrame, Image, …).
Tutoriels et documentation#
Data science with Julia : Série de notebooks bien faits sur la manipulation des tableaux et l’algèbre linéaire en Julia. Très peu de « data science » finalement. Je pense que ces supports sont particulièrement bien adaptés aux débutants venant de R, Python ou MATLAB.
Julia for Data Science : Deux notebooks dans ce dépôt. Un premier sur le package DataFrames.jl. Un deuxième notebook sur le chargement parallèle de fichiers CSV. L’intérêt de ce travail est de comparer les performances avec R et Python.
Divers#
Vous pouvez vous inscrire à la conférence JuliaCon 2020 qui aura lieu en ligne à la fin du mois de juillet. Attention l’inscription est gratuite, mais obligatoire.
L’IDE Juno va migrer progressivement d’Atom vers VSCode. Personnellement je n’ai jamais été convaincu par ce logiciel. Peut être qu’avec VSCODE ce sera mieux, l’alternative à Jupyter est pas mal.
Voter pour le Julia Community Prize Nominations 2020 pour récompenser le développeur de votre package préféré. Vous ne pourrez pas voter pour les anciens lauréats que je liste ci-dessous, et que je conseille de suivre sur GitHub: