begin process at 2008 07 25 10:29:15
1 216 107 membres
84 nouveaux aujourd'hui
14 180 membres club

Vous ne trouvez pas de réponse à votre problème ? Alors posez la question dans le forum.
Souvenez-vous qu'il n'y a jamais de question bête, mais rester dans l'ignorance parce que l'on n'ose pas poser une question, ça c'est une erreur !

ASPIRATEUR D' URLS DANS LE CODE HTML D'UNE PAGE WEB


Information sur la source

Description

tout est dans le titre, ce code est simple il cherche les urls dans le code source
d' une page internet spécifiée.

Source

  • #Importation de la lib pour utiliser la classe URLLister
  • from sgmllib import SGMLParser
  • import sys
  • if len(sys.argv) != 2:
  • print "\n\n****************************************************"
  • print "Aspirateur d' URL dans une Page web !!! "
  • print "********************************************************"
  • print "\nUsage : ./aspy.py <page_web> "
  • print "ex: ./aspy.py http://www.exemple.com "
  • print "\n******************************************************"
  • sys.exit(1)
  • # classe qui va nous servir a chercher les URLS dans la page web.
  • class URLLister(SGMLParser):
  • def reset(self):
  • SGMLParser.reset(self)
  • self.urls = []
  • def start_a(self, attrs):
  • href = [v for k, v in attrs if k=='href']
  • if href:
  • self.urls.extend(href)
  • if __name__ == "__main__":
  • import urllib
  • print "\n##########################################################"
  • print "# #"
  • print "# ASPY-1.0 By tOnyH2 JfF #"
  • print "# contact : grunt_tony@hotmail.fr #"
  • print "# #"
  • print "##########################################################\n"
  • link = sys.argv[1]
  • try:
  • usock = urllib.urlopen(link)
  • parser = URLLister()
  • parser.feed(usock.read())
  • parser.close()
  • usock.close()
  • for url in parser.urls: print url
  • except:
  • print "aucun resultats, reesayez avec un autre Url..."+ sys.argv[1]+ " !"
#Importation de la lib pour utiliser la classe URLLister
from sgmllib import SGMLParser
import sys

if len(sys.argv) != 2:
        print "\n\n****************************************************"
        print "Aspirateur d' URL dans une Page web !!!          "
        print "********************************************************"
        print "\nUsage : ./aspy.py <page_web>            "
        print "ex: ./aspy.py http://www.exemple.com          "
        print "\n******************************************************"
        sys.exit(1)


# classe qui va nous servir a chercher les URLS dans la page web.
class URLLister(SGMLParser):
        def reset(self):
                SGMLParser.reset(self)
                self.urls = []

        def start_a(self, attrs):
                href = [v for k, v in attrs if k=='href']
                if href:
                        self.urls.extend(href)

if __name__ == "__main__":

        import urllib
        print "\n##########################################################"
        print "#                                                        #"
        print "#               ASPY-1.0 By tOnyH2 JfF                   #"
        print "#           contact : grunt_tony@hotmail.fr              #"
        print "#                                                        #"
        print "##########################################################\n"
        link = sys.argv[1]
        try:
                usock = urllib.urlopen(link)
                parser = URLLister()
                parser.feed(usock.read())
                parser.close()
                usock.close()
                for url in parser.urls: print url
        except:
                print "aucun resultats, reesayez avec un autre Url..."+ sys.argv[1]+ " !"
                
Pour les "Membres Club", vous pouvez télécharger directement un fichier contenu dans le zip sans télécharger le zip en entier !

Télécharger le zip

  • signaler à un administrateur
    Commentaire de miss fafa le 30/04/2007 22:50:46

    mais comment utiliser ce programme

Ajouter un commentaire

Pub



Appels d'offres

Creation portail video
Budget : 3 000€
Site de e-commerce
Budget : 5 000€
Demande de devis pour ...
Budget : 7 000€

CalendriCode

Juillet 2008
LMMJVSD
 123456
78910111213
14151617181920
21222324252627
28293031   

VS Express FR Gratuit !

VS Express en français et 100% gratuit !

Téléchargements

Logiciels à télécharger sur le même thème :

Boutique

Boutique de goodies CodeS-SourceS