Pour continuer dans la série d'articles autour de Python (le premier article Python - Introduction aux décorateurs (decorator) est d’ores et déjà disponible), découvrons la fonction .Pipe. Associé à Pandas, la fonction .Pipe, vous permettra d’améliorer la lisibilité de votre code, grâce à un script Python plus succinct et lisible.
NB : cet article “The PIPE function [python tips]” est disponible en anglais via le profil linkedin de son auteur Christophe Thibault.
Pour continuer dans la série d'articles autour de Python (le premier article Python - Introduction aux décorateurs (decorator) est d’ores et déjà disponible), découvrons la fonction .Pipe. Associé à Pandas, la fonction .Pipe, vous permettra d’améliorer la lisibilité de votre code, grâce à un script Python plus succinct et lisible.
La fonction .pipe peut afficher votre script python dans un formatage plus clair, en évitant ainsi la répétition de lignes avec certaines transformations ou l'utilisation de fonctions imbriquées, Il doit être appliqué avec des fonctions qui attendent pd.Series ou DataFrames. Le formatage est DataFrame.pipe(func, *args, **kwargs).
Mais plutôt que des mots, allons nous entraîner. Voici l'exemple dans la documentation .pipe.
Deux solutions sont alors possibles :
Utiliser des fonctions imbriquées comme suit :
OU utiliser .pipe sur une ligne :
*args et **kwargs sont des arguments de fonction (respectivement arguments non-mots-clés et arguments de mots-clés).
Voici un exemple en Data Science de Tom Augspurger, utilisant Decorators. Cet article est très utile, avec le chaînage de méthodes en général. Par exemple, pour la fonction load(), le décorateur @log_dtypes modifie la fonction load(), puis ensuite @log_shape modifie quant à lui le résultat de la modification précédente.
Pour en savoir plus sur la fonction .Pipe, je vous conseille les lectures suivantes :