Vous ne trouvez pas de réponse à votre problème ? Alors posez la question dans le forum. Souvenez-vous qu'il n'y a jamais de question bête, mais rester dans l'ignorance parce que l'on n'ose pas poser une question, ça c'est une erreur !

ASPIRATEUR D' URLS DANS LE CODE HTML D'UNE PAGE WEB


Information sur la source

Description

Cliquez pour voir la capture en taille normale
tout est dans le titre, ce code est simple il cherche les urls dans le code source
d' une page internet spécifiée.
 

Source

  • #Importation de la lib pour utiliser la classe URLLister
  • from sgmllib import SGMLParser
  • import sys
  • if len(sys.argv) != 2:
  • print "\n\n****************************************************"
  • print "Aspirateur d' URL dans une Page web !!! "
  • print "********************************************************"
  • print "\nUsage : ./aspy.py <page_web> "
  • print "ex: ./aspy.py http://www.exemple.com "
  • print "\n******************************************************"
  • sys.exit(1)
  • # classe qui va nous servir a chercher les URLS dans la page web.
  • class URLLister(SGMLParser):
  • def reset(self):
  • SGMLParser.reset(self)
  • self.urls = []
  • def start_a(self, attrs):
  • href = [v for k, v in attrs if k=='href']
  • if href:
  • self.urls.extend(href)
  • if __name__ == "__main__":
  • import urllib
  • print "\n##########################################################"
  • print "# #"
  • print "# ASPY-1.0 By tOnyH2 JfF #"
  • print "# contact : grunt_tony@hotmail.fr #"
  • print "# #"
  • print "##########################################################\n"
  • link = sys.argv[1]
  • try:
  • usock = urllib.urlopen(link)
  • parser = URLLister()
  • parser.feed(usock.read())
  • parser.close()
  • usock.close()
  • for url in parser.urls: print url
  • except:
  • print "aucun resultats, reesayez avec un autre Url..."+ sys.argv[1]+ " !"
#Importation de la lib pour utiliser la classe URLLister
from sgmllib import SGMLParser
import sys

if len(sys.argv) != 2:
        print "\n\n****************************************************"
        print "Aspirateur d' URL dans une Page web !!!          "
        print "********************************************************"
        print "\nUsage : ./aspy.py <page_web>            "
        print "ex: ./aspy.py http://www.exemple.com          "
        print "\n******************************************************"
        sys.exit(1)


# classe qui va nous servir a chercher les URLS dans la page web.
class URLLister(SGMLParser):
        def reset(self):
                SGMLParser.reset(self)
                self.urls = []

        def start_a(self, attrs):
                href = [v for k, v in attrs if k=='href']
                if href:
                        self.urls.extend(href)

if __name__ == "__main__":

        import urllib
        print "\n##########################################################"
        print "#                                                        #"
        print "#               ASPY-1.0 By tOnyH2 JfF                   #"
        print "#           contact : grunt_tony@hotmail.fr              #"
        print "#                                                        #"
        print "##########################################################\n"
        link = sys.argv[1]
        try:
                usock = urllib.urlopen(link)
                parser = URLLister()
                parser.feed(usock.read())
                parser.close()
                usock.close()
                for url in parser.urls: print url
        except:
                print "aucun resultats, reesayez avec un autre Url..."+ sys.argv[1]+ " !"
                

Fichier Zip

Pour les "Membres Club", vous pouvez télécharger directement un fichier contenu dans le zip sans télécharger le zip en entier !

Télécharger le zip

Commentaires et avis

signaler à un administrateur
Commentaire de miss fafa le 30/04/2007 22:50:46

mais comment utiliser ce programme

Ajouter un commentaire

Discussions en rapport avec ce code source dans le forum

Surveiller les échanges sur internet [ par aera group ] Bonjour,Je souhaite développer un petit programme de contrôle d'Interent sur un PC (comme pour faire un logiciel de contrôl parental par exemple). J'a serveur local redirigé vers page web [ par alix20 ] Bojour à tous,voilà, je suis complètement débutante en python (je découvre python grace à Swinnen) et j'ai une question qui semblera peut-être ridicul Ouvrir une page web avec mozilla avec python [ par Shakan972 ] Bonsoir tout le monde je souhaiterais savoir la manière d'ouvrir une page web à l'aide de python et cela sous mozilla.Je sais en effet que la commande python ou php ? [ par eric35 ] Salut J' hésite entre ces 2 langages ...Avant de choisir l'un ou l 'autre, pouvez vous me donner  à titre d 'exemple, quel serait le code pour lancer Modifier titre page html [ par miniimoi ] Bonjour,je dois créer un proxy en python pour un projet et il faut que je recupere le titre de la page html et le modifier.Je suis novice dans ce doma Comment ouvrir une page web? [ par tipro75 ] Comment peut-on ouvrir un fichier (text dans ce cas(format html dans ce cas)) sur internet exemple :je veut lire une page toute les 1 minute pour voir Comment fair un robot qui puisse fair des des actions sur internet ? [ par tipro75 ] Bonjour, esque qu'el qu'un sait Comment fair un robot&nbsp; qui puisse fair des des actions sur internet ? merci d'avance cordialement ********. Connexion internet (je n'arrive pas à ouvrir Internet Explorer) [ par atoutcoeur13 ] Bonjour &#224; toutes et tous,&nbsp;J'ai un soucis de connexion et j'aimerais avoir une r&#233;ponse assez rapide.Voil&#224;!La fille de ma copine a r Script Python pour html [ par aera group ] Bonjour, je uis actuelement au chapitre 17 du tutoriel de Gérard Swinnen : Apprendre à programmer avec Python (téléchargable sur http://www.cifen.ulg.


Nos sponsors

Sondage...

CalendriCode

Juillet 2009
LMMJVSD
  12345
6789101112
13141516171819
20212223242526
2728293031  

Consulter la suite du CalendriCode

Téléchargements

Comparez les prix Nouvelle version

Photothèque Nouveau !



Développement réalisé par Nicolas SOREL (Nix) avec l'aide de : Cyril DURAND et Emmanuel (EBArtSoft), Merci à Vincent pour ses précieux conseils
CodeS-SourceS.com© Toute reproduction même partielle est interdite sauf accord écrit du Webmaster
CodeS-SourceS.com© est une marque déposée tous droits réservés
Temps d'éxécution de la page : 0,094 sec

Google Coop CodeS-SourceS Google Coop CodeS-SourceS


Certaines images présentes sur le site (notament certains avatars) sont issues des collections IconShock, donc si vous souhaitez utiliser ces icons vous devez les acheter, ne les copiez pas et ne utilisez pas dans vos sites et applications sans les avoir commandé.