begin process at 2008 07 25 09:59:02
1 216 107 membres
84 nouveaux aujourd'hui
14 180 membres club

Vous ne trouvez pas de réponse à votre problème ? Alors posez la question dans le forum.
Souvenez-vous qu'il n'y a jamais de question bête, mais rester dans l'ignorance parce que l'on n'ose pas poser une question, ça c'est une erreur !

Sujet : Problème de vitesse exécution d'un script [ Divers / Trucs & Astuces ] (MasterID)

Problème de vitesse exécution d'un script le 17/05/2008 17:41:39

MasterID
Bonjour,

j'ai réalisé un script qui récupère des informations dans un fichier texte, les traitent et retourne un autre fichier texte.
Le fichier texte créé peut-être très très lourd (plusieurs dizaines de Mo, sur plusieurs centaines de milliers de lignes).

Pour ce faire, chaque nouvelle ligne créée est concaténée dans une variable globale (il y a plusieurs boucles imbriquées d'où la longueur du fichier final) et ce n'est qu'à la fin du script que je crée le fichier et y entre toutes les informations.

Après différents tests, il semble que c'est la concaténation des nouvelles lignes dans la variable globale qui prend de plus en plus de temps (je suppose que plus cette variable grossi plus python a dû mal à y ajouter du texte).

J'aimerais savoir comment y palier, car il m'est quasiment impossible de créer un fichier qui dépasse les 10Mo.

Quelle est la méthode optimale ? La création de plusieurs variables globales intermédiaires afin de réduire la taille de chacune et ainsi faciliter la concaténation ? Ecrire au fur et à mesure dans le fichier  ? (bien que je préfèrerais que le fichier ne soit pas créé tant que le script n'est pas terminé, et qu'il me semble que les accès fichier sont très long).

Voilà, j'espère que vous pourrez m'aider, je ne programme que pour le plaisir, je n'ai que peu de notion sur l'efficacité d'un script.

Au revoir.

Re : Problème de vitesse exécution d'un script le 19/05/2008 00:12:46

lespinx
Réponse acceptée !
Bonsoir MasterID

Je suppose que pour concaténer la variable tu utilises la méthode:
chaine = chaine + "aaaaa"
ou bien
chaine += "aaaaa"

Je ne crois pas me tromper en disant que sous Python l'objet chaine n'est pas modifiable.
Pour pouvoir réaliser l'instruction "chaine = chaine + "aaaaa" Python doit détruire l'ancien objet chaine pour pouvoir recréer le nouvel objet chaine, ce qui devient rapidement très couteux.

Je suggère de stocker les variables intermédiaires dans une liste et de réaliser la concaténation finale par la méthode ".join"

lst_chaine = []
lst_chaine.append("aaaaaaaa")
lst_chaine.append("bbbbbbb")
lst_chaine.append("ccccc")
#Concaténation finale
chaine = "".join(lst_chaine)
print chaine

Malgré tout, je pense que l'écriture au fur et mesure dans un fichier en sortie me semble plus naturel et pas obligatoirement plus long.
L'écriture est asynchrone seul le remplissage du buffer ralentira le traitement.
Le mieux est de faire un test.

Cordialement


Re : Problème de vitesse exécution d'un script le 23/05/2008 15:30:54

MasterID
Bonjour,

Merci beaucoup, j'ai utilisé la méthode .join après avoir stocké les variables dans une table, le résultat est plutôt concluant. J'ai pu créer un fichier texte de 20.9 Mo sur 370 000 lignes en 20 secondes, ce qui est amplement suffisant.
Je n'ai pas essayé d'écrire au fur et à mesure dans le fichier, mais y-a-t'il un moyen de supprimer le fichier en cas d'erreur au cours de l'éxecution du script (et ce quelle que soit l'erreur) ?

Et encore merci .

Re : Problème de vitesse exécution d'un script le 24/05/2008 11:30:12

lespinx
Bonjour
... mais y-a-t'il un moyen de supprimer le fichier en cas d'erreur au cours de l'éxecution du script (et ce quelle que soit l'erreur) ?...

Tu peut utilser TRY et EXCEPT pour la gestion des erreurs (voir la doc)
Exemple:

# -*- coding: cp1252 -*-
import os

try:
    monfichier = open("monfichier.txt","w")
    gloupssss   #<=== erreur garantie
    #Suite des instructions du programme
    #...
except:
    print "erreur"
    monfichier.close()
    os.remove("monfichier.txt")
#Si le fichier n'est pas dans le répertoire courant il faut indiquer le chemin complet


Classé sous : fichier, script, problème, variable, texte

Participer à cet échange

Pub



Appels d'offres

Creation portail video
Budget : 3 000€
Site de e-commerce
Budget : 5 000€
Demande de devis pour ...
Budget : 7 000€

CalendriCode

Juillet 2008
LMMJVSD
 123456
78910111213
14151617181920
21222324252627
28293031   

Téléchargements

Logiciels à télécharger sur le même thème :

Boutique

Boutique de goodies CodeS-SourceS