begin process at 2012 02 05 01:10:58
  Trouver un code source :
 
dans
 
Accueil > 

Code

 > 

Réseau & internet

 > ASPIRATEUR D' URLS DANS LE CODE HTML D'UNE PAGE WEB

ASPIRATEUR D' URLS DANS LE CODE HTML D'UNE PAGE WEB


 Information sur la source

Note :
9 / 10 - par 1 personne
9,00 / 10

  • 1

  • 2

  • 3

  • 4

  • 5

  • 6

  • 7

  • 8

  • 9

  • 10
Catégorie :Réseau & internet Classé sous :aspirateur, page, codesource, internet, listeururls Niveau :Débutant Date de création :25/10/2006 Vu / téléchargé :6 369 / 336

Auteur : kerneltony95

Ecrire un message privé
Site perso
Commentaire sur cette source (1)
Ajouter un commentaire et/ou une note

 Description

Cliquez pour voir la capture en taille normale
tout est dans le titre, ce code est simple il cherche les urls dans le code source
d' une page internet spécifiée.

Source

  • #Importation de la lib pour utiliser la classe URLLister
  • from sgmllib import SGMLParser
  • import sys
  • if len(sys.argv) != 2:
  • print "\n\n****************************************************"
  • print "Aspirateur d' URL dans une Page web !!! "
  • print "********************************************************"
  • print "\nUsage : ./aspy.py <page_web> "
  • print "ex: ./aspy.py http://www.exemple.com "
  • print "\n******************************************************"
  • sys.exit(1)
  • # classe qui va nous servir a chercher les URLS dans la page web.
  • class URLLister(SGMLParser):
  • def reset(self):
  • SGMLParser.reset(self)
  • self.urls = []
  • def start_a(self, attrs):
  • href = [v for k, v in attrs if k=='href']
  • if href:
  • self.urls.extend(href)
  • if __name__ == "__main__":
  • import urllib
  • print "\n##########################################################"
  • print "# #"
  • print "# ASPY-1.0 By tOnyH2 JfF #"
  • print "# contact : grunt_tony@hotmail.fr #"
  • print "# #"
  • print "##########################################################\n"
  • link = sys.argv[1]
  • try:
  • usock = urllib.urlopen(link)
  • parser = URLLister()
  • parser.feed(usock.read())
  • parser.close()
  • usock.close()
  • for url in parser.urls: print url
  • except:
  • print "aucun resultats, reesayez avec un autre Url..."+ sys.argv[1]+ " !"
#Importation de la lib pour utiliser la classe URLLister
from sgmllib import SGMLParser
import sys

if len(sys.argv) != 2:
        print "\n\n****************************************************"
        print "Aspirateur d' URL dans une Page web !!!          "
        print "********************************************************"
        print "\nUsage : ./aspy.py <page_web>            "
        print "ex: ./aspy.py http://www.exemple.com          "
        print "\n******************************************************"
        sys.exit(1)


# classe qui va nous servir a chercher les URLS dans la page web.
class URLLister(SGMLParser):
        def reset(self):
                SGMLParser.reset(self)
                self.urls = []

        def start_a(self, attrs):
                href = [v for k, v in attrs if k=='href']
                if href:
                        self.urls.extend(href)

if __name__ == "__main__":

        import urllib
        print "\n##########################################################"
        print "#                                                        #"
        print "#               ASPY-1.0 By tOnyH2 JfF                   #"
        print "#           contact : grunt_tony@hotmail.fr              #"
        print "#                                                        #"
        print "##########################################################\n"
        link = sys.argv[1]
        try:
                usock = urllib.urlopen(link)
                parser = URLLister()
                parser.feed(usock.read())
                parser.close()
                usock.close()
                for url in parser.urls: print url
        except:
                print "aucun resultats, reesayez avec un autre Url..."+ sys.argv[1]+ " !"
                


 Fichier Zip

Les Membres Club peuvent télécharger directement un fichier contenu dans le zip sans télécharger le zip en entier !

Télécharger le zip


 Sources du même auteur

SCANNER D' ADRESSES MAILS (ENTREPRISES, MESSAGERIES, BOITE ...

 Sources de la même categorie

SOCKET MULTITHREAD SIMPLE par Guillamue06
TRANSFERT DE FICHIER PAR SOCKET par Guillamue06
Source avec une capture AUTO-FOLLOW/UNFOLLOW [TWITTER] EN [PERL] UTILISANT NET::TWIT... par GeroXXXX
Source avec Zip PINGEUR RÉSEAU par jeanbleo44
Source avec Zip Source avec une capture LISTING ET LOGS DES CONNEXIONS ET DECONNEXIONS DE MACHINES Q... par saigneurdushi

 Sources en rapport avec celle ci

TÉLCHARGEUR YOUTUBE par rezuz
Source avec Zip Source avec une capture BLOQUEUR INTERNET par amaury74
Source avec Zip Source avec une capture 'MES CONNEXIONS' OU COMMENT CONNAITRE LES CONNEXIONS ET LES ... par stephane70
Source avec Zip ENVOIE DE MAIL ET OUVERTURE DE NAVIGATEUR INTERNET ALÉATOIRE par kalla
Source avec Zip INFORMATIONS SUR UN ISBN DEPUIS INTERNET par lepecheur

Commentaires et avis

Commentaire de miss fafa le 30/04/2007 22:50:46

mais comment utiliser ce programme

 Ajouter un commentaire


Discussions en rapport avec ce code source dans le forum

Surveiller les échanges sur internet [ par aera group ] Bonjour,Je souhaite développer un petit programme de contrôle d'Interent sur un PC (comme pour faire un logiciel de contrôl parental par exemple). J'a serveur local redirigé vers page web [ par alix20 ] Bojour à tous,voilà, je suis complètement débutante en python (je découvre python grace à Swinnen) et j'ai une question qui semblera peut-être ridicul Ouvrir une page web avec mozilla avec python [ par Shakan972 ] Bonsoir tout le monde je souhaiterais savoir la manière d'ouvrir une page web à l'aide de python et cela sous mozilla.Je sais en effet que la commande python ou php ? [ par eric35 ] Salut J' hésite entre ces 2 langages ...Avant de choisir l'un ou l 'autre, pouvez vous me donner  à titre d 'exemple, quel serait le code pour lancer Modifier titre page html [ par miniimoi ] Bonjour,je dois créer un proxy en python pour un projet et il faut que je recupere le titre de la page html et le modifier.Je suis novice dans ce doma conversion de code python [ par gortex3D ] Hello tout le monde Je viens ici demander de l'aide. Je programme un petit peu en windev mais je ne connais pas d'autres language de programmation à probleme avec karrigell [ par majiddus ] bonjour je suis debutant en python,dans le but d'heberger un site web, j'ai installé le serveur karrigell,a partir de mon resau local tout marche bien Comment ouvrir une page web? [ par tipro75 ] Comment peut-on ouvrir un fichier (text dans ce cas(format html dans ce cas)) sur internet exemple :je veut lire une page toute les 1 minute pour voir Comment fair un robot qui puisse fair des des actions sur internet ? [ par tipro75 ] Bonjour, esque qu'el qu'un sait Comment fair un robot&nbsp; qui puisse fair des des actions sur internet ? merci d'avance cordialement ********. Connexion internet (je n'arrive pas à ouvrir Internet Explorer) [ par atoutcoeur13 ] Bonjour &#224; toutes et tous,&nbsp;J'ai un soucis de connexion et j'aimerais avoir une r&#233;ponse assez rapide.Voil&#224;!La fille de ma copine a r


Nos sponsors


Sondage...

Comparez les prix

CalendriCode

Février 2012
LMMJVSD
  12345
6789101112
13141516171819
20212223242526
272829    

Consulter la suite du CalendriCode

Photothèque

 
Développement réalisé par Nicolas SOREL (Nix) avec l'aide de : Cyril DURAND et Emmanuel (EBArtSoft), Merci à Vincent pour ses précieux conseils.
CodeS-SourceS.com© Toute reproduction même partielle est interdite sauf accord écrit du Webmaster
CodeS-SourceS.com© est une marque déposée tous droits réservés

Google Coop CodeS-SourceS Google Coop CodeS-SourceS
Temps d'éxécution de la page : 0,827 sec (4)

Nous contacter | Annoncer sur CodeS-SourceS | Mentions légales