Accueil > > > ASPIRATEUR D' URLS DANS LE CODE HTML D'UNE PAGE WEB
ASPIRATEUR D' URLS DANS LE CODE HTML D'UNE PAGE WEB
Information sur la source
Description
tout est dans le titre, ce code est simple il cherche les urls dans le code source d' une page internet spécifiée.
Source
- #Importation de la lib pour utiliser la classe URLLister
- from sgmllib import SGMLParser
- import sys
-
- if len(sys.argv) != 2:
- print "\n\n****************************************************"
- print "Aspirateur d' URL dans une Page web !!! "
- print "********************************************************"
- print "\nUsage : ./aspy.py <page_web> "
- print "ex: ./aspy.py http://www.exemple.com "
- print "\n******************************************************"
- sys.exit(1)
-
-
- # classe qui va nous servir a chercher les URLS dans la page web.
- class URLLister(SGMLParser):
- def reset(self):
- SGMLParser.reset(self)
- self.urls = []
-
- def start_a(self, attrs):
- href = [v for k, v in attrs if k=='href']
- if href:
- self.urls.extend(href)
-
- if __name__ == "__main__":
-
- import urllib
- print "\n##########################################################"
- print "# #"
- print "# ASPY-1.0 By tOnyH2 JfF #"
- print "# contact : grunt_tony@hotmail.fr #"
- print "# #"
- print "##########################################################\n"
- link = sys.argv[1]
- try:
- usock = urllib.urlopen(link)
- parser = URLLister()
- parser.feed(usock.read())
- parser.close()
- usock.close()
- for url in parser.urls: print url
- except:
- print "aucun resultats, reesayez avec un autre Url..."+ sys.argv[1]+ " !"
-
#Importation de la lib pour utiliser la classe URLLister
from sgmllib import SGMLParser
import sys
if len(sys.argv) != 2:
print "\n\n****************************************************"
print "Aspirateur d' URL dans une Page web !!! "
print "********************************************************"
print "\nUsage : ./aspy.py <page_web> "
print "ex: ./aspy.py http://www.exemple.com "
print "\n******************************************************"
sys.exit(1)
# classe qui va nous servir a chercher les URLS dans la page web.
class URLLister(SGMLParser):
def reset(self):
SGMLParser.reset(self)
self.urls = []
def start_a(self, attrs):
href = [v for k, v in attrs if k=='href']
if href:
self.urls.extend(href)
if __name__ == "__main__":
import urllib
print "\n##########################################################"
print "# #"
print "# ASPY-1.0 By tOnyH2 JfF #"
print "# contact : grunt_tony@hotmail.fr #"
print "# #"
print "##########################################################\n"
link = sys.argv[1]
try:
usock = urllib.urlopen(link)
parser = URLLister()
parser.feed(usock.read())
parser.close()
usock.close()
for url in parser.urls: print url
except:
print "aucun resultats, reesayez avec un autre Url..."+ sys.argv[1]+ " !"
Sources de la même categorie
Commentaires et avis
Discussions en rapport avec ce code source dans le forum
Surveiller les échanges sur internet [ par aera group ]
Bonjour,Je souhaite développer un petit programme de contrôle d'Interent sur un PC (comme pour faire un logiciel de contrôl parental par exemple). J'a
serveur local redirigé vers page web [ par alix20 ]
Bojour à tous,voilà, je suis complètement débutante en python (je découvre python grace à Swinnen) et j'ai une question qui semblera peut-être ridicul
Ouvrir une page web avec mozilla avec python [ par Shakan972 ]
Bonsoir tout le monde je souhaiterais savoir la manière d'ouvrir une page web à l'aide de python et cela sous mozilla.Je sais en effet que la commande
python ou php ? [ par eric35 ]
Salut J' hésite entre ces 2 langages ...Avant de choisir l'un ou l 'autre, pouvez vous me donner à titre d 'exemple, quel serait le code pour lancer
Modifier titre page html [ par miniimoi ]
Bonjour,je dois créer un proxy en python pour un projet et il faut que je recupere le titre de la page html et le modifier.Je suis novice dans ce doma
Comment ouvrir une page web? [ par tipro75 ]
Comment peut-on ouvrir un fichier (text dans ce cas(format html dans ce cas)) sur internet exemple :je veut lire une page toute les 1 minute pour voir
Comment fair un robot qui puisse fair des des actions sur internet ? [ par tipro75 ]
Bonjour, esque qu'el qu'un sait Comment fair un robot qui puisse fair des des actions sur internet ? merci d'avance cordialement ********.
Connexion internet (je n'arrive pas à ouvrir Internet Explorer) [ par atoutcoeur13 ]
Bonjour à toutes et tous, J'ai un soucis de connexion et j'aimerais avoir une réponse assez rapide.Voilà!La fille de ma copine a r
Script Python pour html [ par aera group ]
Bonjour, je uis actuelement au chapitre 17 du tutoriel de Gérard Swinnen : Apprendre à programmer avec Python (téléchargable sur http://www.cifen.ulg.
|
Derniers Blogs
TECHDAYS PARIS 2010 : LA BI DANS SHAREPOINT 2010TECHDAYS PARIS 2010 : LA BI DANS SHAREPOINT 2010 par ROMELARD Fabrice
Animé par: Vincent Bellet et Baptiste Giraudier La BI dans SharePoint 2010, Les nouveaux services d'application dans SP2010 et SQL Server Reporting services 2008 R2. La BI dans SharePoint est généralisée pour tous afin de permettre à tous les coll...
Cliquez pour lire la suite de l'article par ROMELARD Fabrice TECHDAYS PARIS 2010 : PLAN DE MIGRATION VERS SHAREPOINT 2010TECHDAYS PARIS 2010 : PLAN DE MIGRATION VERS SHAREPOINT 2010 par ROMELARD Fabrice
Animé par: Arnault Nouvel et Antoine Dongois Le processus à prendre : Apprendre (découvrir la plateforme) Préparer (documenter l'historique et choisir la méthode de MAJ) Test (Test de MAJ) Implémenter (Effectuer la MAJ) Valid...
Cliquez pour lire la suite de l'article par ROMELARD Fabrice TECHDAYS PARIS 2010 : LA PLEINIèRE DU SECOND JOURTECHDAYS PARIS 2010 : LA PLEINIèRE DU SECOND JOUR par ROMELARD Fabrice
Après un retour sur l'histoire des TechDays de Paris et le fait que ce soit le plus gros event MS au monde (du fait de sa gratuité), le président de MS France (Eric Boustoullier) a fait une présentation de la vision Microsoft pour les années à venir...
Cliquez pour lire la suite de l'article par ROMELARD Fabrice
Logiciels
DB-MAIN (9.1.0)DB-MAIN (9.1.0)DB-MAIN is a data-modeling and data-architecture tool. It is designed to help developers and anal... Cliquez pour télécharger DB-MAIN Xilisoft DPG Convertisseur (5.1.37.0120)XILISOFT DPG CONVERTISSEUR (5.1.37.0120)Xilisoft DPG Convertisseur offre aux fans de Nintendo DS une bonne solution leur permettant de dé... Cliquez pour télécharger Xilisoft DPG Convertisseur GraphicsGale (2.01.01)GRAPHICSGALE (2.01.01)GraphicsGale est un logiciel de PixelArt avec de nombreuse fonctionnalités permettant de réalisé ... Cliquez pour télécharger GraphicsGale Architecte 3D (Platinum 2010)ARCHITECTE 3D (PLATINUM 2010)Architecte 3D Platinium vous permet de concevoir facilement les plans votre future maison, de l'é... Cliquez pour télécharger Architecte 3D TeamViewer 5 (TeamViewer 5)TEAMVIEWER 5 (TEAMVIEWER 5)Dépanner un ami,expliquer une manipulation devient un jeu d'enfant.
Prise en main d'un autre ord... Cliquez pour télécharger TeamViewer 5
|