Accueil > > > LIRE ET PARSER UN FICHIER NZB ( XML AVEC SAX)
LIRE ET PARSER UN FICHIER NZB ( XML AVEC SAX)
Information sur la source
Description
Ce petit script permet de lire et d'extraire les informations contenus dans un fichier nzb C'est une classe qui fait partie d'un projet plus important dans le but et de réaliser un grabeur de news. Cet outils codé entièrement en python permetera de telecharger des fichiers sur les usenet binaires a partir d'un fichier Nzb. Temps de travail : 2H
Source
- # -*- coding: utf-8 -*-
-
- #-#####################################################
- #- Classe permetant de gerer les fichiers Nzb #
- #-
- #- Ce code n'est que la partie d'un projet plus vaste dans le but est de réaliser un client usenet
- #- en python ou en C++
- #- Ce code doit etre amélioré notament en geran au mieu les exceptions et en ajputant d'autres fonctionnalite
- #- temps passe a coder et valider = 2H
- #- Coded by azalsup@free.fr
- #- Code ouvert sans conditions
- #-
- #-#####################################################
-
- __revision__ = 0.1
-
- # Les includes se font par ici
- from xml.sax import make_parser
- from xml.sax.handler import ContentHandler
-
-
- #Les fonctions elementaires necessaires au bon fonctionnement du programme
- def END() :
- """Areter le programme"""
- sys.exit()
-
- def ERROR(msg):
- """Affiche un message d'erreur"""
-
- print '#'*len(msg)
- print msg
- print '#'*len(msg)
- END()
-
- def WARNING(msg):
- """Affiche un message de prevention"""
-
- print '*'*len(msg)
- print msg
- print '*'*len(msg)
-
- def INFO(msg):
- """Affiche un message d'information"""
-
- print '@'*len(msg)
- print msg
- print '@'*len(msg)
-
- #Classe pour gerer un segment de fichier
- class NzbSegment :
- """Classe pour refferencer un segment d'un fichier"""
-
- def __init__(self, bytes , number , content = ''):
- """Constructeur de la classe"""
- self.bytes = bytes
- self.number = number
- self.content = content
-
- def addContent(self, content):
- """Modifier la valeur de self.content"""
- self.content += content
-
- def getContent(self):
- """Retourne la valeur de self.content"""
- return self.content
-
- #Classe pour stocker les ref. d'un fichier du Nzb
- class NzbFile:
- """Les ref. d'un fichier refference dans le Nzb"""
-
- def __init__(self, subject, date , poster):
- """Constructeur de la classe"""
- self.subject = subject
- self.date = date
- self.poster = poster
-
- self.groups = []
- self.segments = []
-
-
- def addGroup(self, group):
- """Ajouter un groupe"""
- self.groups.append(group)
-
- def addGroups(self, groups) :
- """Ajouter plusieurs groupes a la fois"""
- self.groups += groups
-
- def addSegment(self, segment):
- """Ajouter un segment"""
- self.segments.append(segment)
-
-
-
- #Classe pour parser le fichier Nzb
- class NzbHandler(ContentHandler) :
- '''Classe pour parser le fichier nzb'''
-
- def __init__(self):
- """initialisation"""
- self.files = []
- self.nbNzb = 0
-
- #Si cette valeur est a True on est dans une balise nzb
- self.e_nzb = False
- self.tmpFile = None
- self.tmpGroups = None
- self.tmpGroup = None
- self.tmpSegments = None
- self.tmpSegment = None
-
- def addFile(self, file):
- """ Ajouter un fichier"""
- self.files.append(file)
-
-
- def startDocument(self):
- """fonction appelée lorsque le parser rencontre le premier élement"""
- pass
-
- def startElement(self, name, attrs):
- """fonction appelée lorsque le parser rencontre une balise ouvrante"""
- if name == "nzb" :
- self.nbNzb += 1
- self.e_nzb = True
-
- elif name == "file" and self.e_nzb:
- self.tmpFile = NzbFile(attrs.getValue('subject'), attrs.getValue('date') , attrs.getValue('poster'))
-
- elif name == 'groups' and self.tmpFile != None :
- self.tmpGroups = []
-
- elif name == 'group' and self.tmpGroups != None :
- self.tmpGroup = ''
-
- elif name == 'segments' and self.tmpFile != None :
- self.tmpSegments = []
-
- elif name == 'segment' and self.tmpSegments != None :
- self.tmpSegment = NzbSegment(attrs.getValue('bytes') , attrs.getValue('number') )
-
- def endElement(self, name):
- """fonction appelée lorsque le parser rencontre une balise fermante"""
- if name == "nzb" :
- self.e_nzb = False
-
- elif name == "file" and self.e_nzb:
- self.files.append(self.tmpFile)
- self.tmpFile = None
-
- elif name == 'groups' and self.tmpFile != None :
- self.tmpFile.addGroups(self.tmpGroups)
- self.tmpGroups = None
-
- elif name == 'group' and self.tmpGroups != None :
- self.tmpGroups.append(self.tmpGroup)
- self.tmpGroup = None
-
- elif name == 'segments' and self.tmpFile != None :
- self.tmpSegments = None
-
- elif name == 'segment' and self.tmpSegments != None :
- self.tmpFile.addSegment(self.tmpSegment)
- self.tmpSegment = None
-
- def characters(self, chrs):
- """fonction appelée lorsque le parser rencontre des données dans un élement"""
- if self.tmpGroup != None :
- self.tmpGroup += chrs
-
- elif self.tmpSegment != None :
- self.tmpSegment.addContent(chrs)
-
- def endDocument(self):
- """fonction appelée lorsque le parser rencontre le dernier élement"""
- pass
-
- # Entree principale du programme
- if __name__ == "__main__" :
-
- _doc = NzbHandler()
- _saxparser = make_parser()
- _saxparser.setContentHandler(_doc)
-
- _datasource = open("test.nzb","r")
- _saxparser.parse(_datasource)
-
- for _f in _doc.files :
- print "#"*8
-
- print "Sujet :",_f.subject
- print "Date :",_f.date
- print "Poster :",_f.poster
-
- print "Liste des groupes :"
- print "___________________"
- for _g in _f.groups :
- print " -", _g
-
- print "Liste des segments :"
- print "____________________"
- for _s in _f.segments :
- print _s.bytes,'-', _s.bytes, '-', _s.number, '-', _s.content
# -*- coding: utf-8 -*-
#-#####################################################
#- Classe permetant de gerer les fichiers Nzb #
#-
#- Ce code n'est que la partie d'un projet plus vaste dans le but est de réaliser un client usenet
#- en python ou en C++
#- Ce code doit etre amélioré notament en geran au mieu les exceptions et en ajputant d'autres fonctionnalite
#- temps passe a coder et valider = 2H
#- Coded by azalsup@free.fr
#- Code ouvert sans conditions
#-
#-#####################################################
__revision__ = 0.1
# Les includes se font par ici
from xml.sax import make_parser
from xml.sax.handler import ContentHandler
#Les fonctions elementaires necessaires au bon fonctionnement du programme
def END() :
"""Areter le programme"""
sys.exit()
def ERROR(msg):
"""Affiche un message d'erreur"""
print '#'*len(msg)
print msg
print '#'*len(msg)
END()
def WARNING(msg):
"""Affiche un message de prevention"""
print '*'*len(msg)
print msg
print '*'*len(msg)
def INFO(msg):
"""Affiche un message d'information"""
print '@'*len(msg)
print msg
print '@'*len(msg)
#Classe pour gerer un segment de fichier
class NzbSegment :
"""Classe pour refferencer un segment d'un fichier"""
def __init__(self, bytes , number , content = ''):
"""Constructeur de la classe"""
self.bytes = bytes
self.number = number
self.content = content
def addContent(self, content):
"""Modifier la valeur de self.content"""
self.content += content
def getContent(self):
"""Retourne la valeur de self.content"""
return self.content
#Classe pour stocker les ref. d'un fichier du Nzb
class NzbFile:
"""Les ref. d'un fichier refference dans le Nzb"""
def __init__(self, subject, date , poster):
"""Constructeur de la classe"""
self.subject = subject
self.date = date
self.poster = poster
self.groups = []
self.segments = []
def addGroup(self, group):
"""Ajouter un groupe"""
self.groups.append(group)
def addGroups(self, groups) :
"""Ajouter plusieurs groupes a la fois"""
self.groups += groups
def addSegment(self, segment):
"""Ajouter un segment"""
self.segments.append(segment)
#Classe pour parser le fichier Nzb
class NzbHandler(ContentHandler) :
'''Classe pour parser le fichier nzb'''
def __init__(self):
"""initialisation"""
self.files = []
self.nbNzb = 0
#Si cette valeur est a True on est dans une balise nzb
self.e_nzb = False
self.tmpFile = None
self.tmpGroups = None
self.tmpGroup = None
self.tmpSegments = None
self.tmpSegment = None
def addFile(self, file):
""" Ajouter un fichier"""
self.files.append(file)
def startDocument(self):
"""fonction appelée lorsque le parser rencontre le premier élement"""
pass
def startElement(self, name, attrs):
"""fonction appelée lorsque le parser rencontre une balise ouvrante"""
if name == "nzb" :
self.nbNzb += 1
self.e_nzb = True
elif name == "file" and self.e_nzb:
self.tmpFile = NzbFile(attrs.getValue('subject'), attrs.getValue('date') , attrs.getValue('poster'))
elif name == 'groups' and self.tmpFile != None :
self.tmpGroups = []
elif name == 'group' and self.tmpGroups != None :
self.tmpGroup = ''
elif name == 'segments' and self.tmpFile != None :
self.tmpSegments = []
elif name == 'segment' and self.tmpSegments != None :
self.tmpSegment = NzbSegment(attrs.getValue('bytes') , attrs.getValue('number') )
def endElement(self, name):
"""fonction appelée lorsque le parser rencontre une balise fermante"""
if name == "nzb" :
self.e_nzb = False
elif name == "file" and self.e_nzb:
self.files.append(self.tmpFile)
self.tmpFile = None
elif name == 'groups' and self.tmpFile != None :
self.tmpFile.addGroups(self.tmpGroups)
self.tmpGroups = None
elif name == 'group' and self.tmpGroups != None :
self.tmpGroups.append(self.tmpGroup)
self.tmpGroup = None
elif name == 'segments' and self.tmpFile != None :
self.tmpSegments = None
elif name == 'segment' and self.tmpSegments != None :
self.tmpFile.addSegment(self.tmpSegment)
self.tmpSegment = None
def characters(self, chrs):
"""fonction appelée lorsque le parser rencontre des données dans un élement"""
if self.tmpGroup != None :
self.tmpGroup += chrs
elif self.tmpSegment != None :
self.tmpSegment.addContent(chrs)
def endDocument(self):
"""fonction appelée lorsque le parser rencontre le dernier élement"""
pass
# Entree principale du programme
if __name__ == "__main__" :
_doc = NzbHandler()
_saxparser = make_parser()
_saxparser.setContentHandler(_doc)
_datasource = open("test.nzb","r")
_saxparser.parse(_datasource)
for _f in _doc.files :
print "#"*8
print "Sujet :",_f.subject
print "Date :",_f.date
print "Poster :",_f.poster
print "Liste des groupes :"
print "___________________"
for _g in _f.groups :
print " -", _g
print "Liste des segments :"
print "____________________"
for _s in _f.segments :
print _s.bytes,'-', _s.bytes, '-', _s.number, '-', _s.content
Sources de la même categorie
Commentaires et avis
Discussions en rapport avec ce code source dans le forum
XML Dom [ par MHI ]
Voici un exemple et une petite explication sympathique que j'ai trouvé sure developpez.com traitant de XML et de l'API DOM :'Utilisation de l'API DOM
python debutant [ par supai ]
print "début" # début procédure from os import chdir chdir("/Volumes/GERTEX/_test/") import shutil, string, re obfic = open("taglist.xml","r") # Le
Importer la Base de registre windows en xml pour la réutiliser en xml. [ par Psychokenshin ]
Bonjour à tous, Je cherche donc à exporter ma base de registre windows dans un fichier xml et ce de façon à pouvoir l'utiliser facilement dans un dic
|
Derniers Blogs
CSS CONTENT STATE SELECTORS (PERSONNAL DRAFT)CSS CONTENT STATE SELECTORS (PERSONNAL DRAFT) par FREMYCOMPANY
Bonjour à tous, Je viens de publier une proposition comprenant 5 pseudo-classes pour le CSS Working Group ayant trait à l'état de chargement d'un élément (ex: IMG,VIDEO,AUDIO,OBJECT pour l'HTML.). Si le c½ur vous en dit, vous pouvez retrouver cette p...
Cliquez pour lire la suite de l'article par FREMYCOMPANY MBA : POURQUOI FAIRE ET COMMENT LE CHOISIR ?MBA : POURQUOI FAIRE ET COMMENT LE CHOISIR ? par ROMELARD Fabrice
Formation initiale Durant la formation, le découpage classique est le suivant (je donnerai les équivalences Suisse lorsque je les connaîtrais) : Ecole primaire jusqu'au Collège : Formation générale permettant d'obtenir les méthodes...
Cliquez pour lire la suite de l'article par ROMELARD Fabrice Y'A DES ERREURS QUI PEUVENT RENDRE LE DéVELOPPEUR VIOLENTY'A DES ERREURS QUI PEUVENT RENDRE LE DéVELOPPEUR VIOLENT par Aleks
Quand on a ce genre d'erreur sans log :
Et bas on a juste envie de choper le gas de Microsoft qu'a développé ça et lui foutre des baffes de Coboye ! ...
Cliquez pour lire la suite de l'article par Aleks [HYPER-V 3] PRéSENTATION DES COMMANDLETS POWERSHELL[HYPER-V 3] PRéSENTATION DES COMMANDLETS POWERSHELL par Pierrick CATRO-BROUILLET
Avec la sortie prochaine de la Beta Consumer Preview de Windows 8, j'avais envie de revenir sur une des fonctionnalités que j'attends le plus et que, en bon geek que je suis, j'utilise déjà : Hyper-V 3 ainsi son module PowerShell.
Il y a déjà pléthor...
Cliquez pour lire la suite de l'article par Pierrick CATRO-BROUILLET IIS7 - COMPRESSION GZIPIIS7 - COMPRESSION GZIP par cyril
La compression GZIP permet d'améliorer les performances de navigation en compressant ce qu'envoie le serveur à un client. Pour comprendre comment cela fonctionne, regardons ce qu'il se passe au niveau HTTP lorsqu'un client tente d'accéder à une ress...
Cliquez pour lire la suite de l'article par cyril
Forum
PYVISA PROBLèMEPYVISA PROBLèME par sandrine44
Cliquez pour lire la suite par sandrine44
Logiciels
Easy-Planning (1.0.0.1)EASY-PLANNING (1.0.0.1)Basé sur les mêmes principes que MyPlanning, Easy-Planning permet de créer des plannings sous la ... Cliquez pour télécharger Easy-Planning Academy System (17.1.3.0)ACADEMY SYSTEM (17.1.3.0)Logiciel de gestion des établissements.
- élèves/étudiants (inscription, dossier, absence...)
-... Cliquez pour télécharger Academy System COLLECTOR PLUS (3.00B)COLLECTOR PLUS (3.00B)COLLECTOR PLUS version 3.00B est un logiciel utilisant une base de données alimentée par :
- L... Cliquez pour télécharger COLLECTOR PLUS PONAMEDIA PREMIUM - HELLLOOO FLASH DEMO (V7.4)PONAMEDIA PREMIUM - HELLLOOO FLASH DEMO (V7.4)PONAMEDIA TV DEVIENS HELLLOOO FLASH
LA TV SUR VOTRE ORDINATEUR.
Toute une plateforme Multi... Cliquez pour télécharger PONAMEDIA PREMIUM - HELLLOOO FLASH DEMO LettresFaciles 2011 (8.0.0.1)LETTRESFACILES 2011 (8.0.0.1)LettresFaciles est un logiciel facilitant la création et la rédaction de lettres types.
Son inte... Cliquez pour télécharger LettresFaciles 2011
|