En avant, juillet 2025 : [Faut-il intégrer de l'IA dans les applications métiers ?]🎉

Accueil

Blog

Article

Optimisez vos jobs Talend pour la copie de table à table

L’ETL Talend permet de paramétrer facilement la copie d’une table vers une autre ayant la même structure.

Christophe DUPONT

Mis à jour le 7 Mai 2025

L’ETL TalendTalend est un logiciel ETL permettant de faire de l'Extract, de la Transformation et du chargement (Load) de données. permet de paramétrer facilement la copie d’une table vers une autre ayant la même structure.

Nous parlerons dans cet article de la copie vers une table vide, où le job ne fera que des INSERT (et pas d’INSERT OR UPDATE, plus consommateur).

Une des bonnes pratiques invite à déclarer dans les jobs une première connexion vers la base source et une seconde vers la base cible, les composants étant ensuite paramètres pour utiliser ces connexions. Cela permet d’ouvrir une unique session vers chacune des bases, évitant ainsi d’ouvrir plusieurs sessions pour un même client.

Illustration d’un job Talend : Les connexions sont déclarées au début du job.

Les composants sont configurés pour utiliser ces connexions.

Néanmoins, si cette solution facilite la maintenance de l’application, elle peut poser des problèmes de performance. En effet lorsqu’un composant d’insertion utilise ce type de connexion, Talend lui interdit l’utilisation de buffer. En conséquence de quoi les performances s’écroulent.

La solution consiste alors à ne pas utiliser une connexion commune mais de la paramétrer sur chacun des composants de type output, comme le montre le paramétrage d’un composant tOracleOutput ci-dessous:

De plus si vous souhaitez encore accellérer le traitement, il est recommandé; d’utiliser un curseur sur la table source, comme on peut le voir sur l’image suivante:

Ainsi en utilisant cette méthode, les insertions sont beaucoup plus rapide, avec un rapport allant jusqu’à; 100 (4000 lignes/seconde contre 40l/s) par rapport à l’utilisation d’une connexion partagée (test réalisée; avec Talend 5.2.1 sur une table de 40 000 enregistrements, base de données Oracle 11g)

Nos podcasts en lien

AXOPEN_HeaderPodcast40_PerennitéApplications.jpg

Pérennité des technologies web & montées de version : attention, terrain glissant !

Écouter le podcast

NPM, Nuget, Maven… Comment bien utiliser les gestionnaires de paquets pour le développement

Écouter le podcast

Pour aller plus loin

Jaspersoft studio – Address family not supported by protocol family : connect

Il est possible dans Jaspersoft studio d’ouvrir des rapports stockées sur un serveur jasperserver.

Les IA copilots dans le développement : notre retour d'expérience

Si vous ne vivez pas dans une grotte, vous avez surement déjà entendu parler de l'IA générative, et à quel point elle "révolutionne" plein de secteurs.