Accueil > > > ASPIRATEUR D' URLS DANS LE CODE HTML D'UNE PAGE WEB
ASPIRATEUR D' URLS DANS LE CODE HTML D'UNE PAGE WEB
Information sur la source
Description
tout est dans le titre, ce code est simple il cherche les urls dans le code source d' une page internet spécifiée.
Source
- #Importation de la lib pour utiliser la classe URLLister
- from sgmllib import SGMLParser
- import sys
-
- if len(sys.argv) != 2:
- print "\n\n****************************************************"
- print "Aspirateur d' URL dans une Page web !!! "
- print "********************************************************"
- print "\nUsage : ./aspy.py <page_web> "
- print "ex: ./aspy.py http://www.exemple.com "
- print "\n******************************************************"
- sys.exit(1)
-
-
- # classe qui va nous servir a chercher les URLS dans la page web.
- class URLLister(SGMLParser):
- def reset(self):
- SGMLParser.reset(self)
- self.urls = []
-
- def start_a(self, attrs):
- href = [v for k, v in attrs if k=='href']
- if href:
- self.urls.extend(href)
-
- if __name__ == "__main__":
-
- import urllib
- print "\n##########################################################"
- print "# #"
- print "# ASPY-1.0 By tOnyH2 JfF #"
- print "# contact : grunt_tony@hotmail.fr #"
- print "# #"
- print "##########################################################\n"
- link = sys.argv[1]
- try:
- usock = urllib.urlopen(link)
- parser = URLLister()
- parser.feed(usock.read())
- parser.close()
- usock.close()
- for url in parser.urls: print url
- except:
- print "aucun resultats, reesayez avec un autre Url..."+ sys.argv[1]+ " !"
-
#Importation de la lib pour utiliser la classe URLLister
from sgmllib import SGMLParser
import sys
if len(sys.argv) != 2:
print "\n\n****************************************************"
print "Aspirateur d' URL dans une Page web !!! "
print "********************************************************"
print "\nUsage : ./aspy.py <page_web> "
print "ex: ./aspy.py http://www.exemple.com "
print "\n******************************************************"
sys.exit(1)
# classe qui va nous servir a chercher les URLS dans la page web.
class URLLister(SGMLParser):
def reset(self):
SGMLParser.reset(self)
self.urls = []
def start_a(self, attrs):
href = [v for k, v in attrs if k=='href']
if href:
self.urls.extend(href)
if __name__ == "__main__":
import urllib
print "\n##########################################################"
print "# #"
print "# ASPY-1.0 By tOnyH2 JfF #"
print "# contact : grunt_tony@hotmail.fr #"
print "# #"
print "##########################################################\n"
link = sys.argv[1]
try:
usock = urllib.urlopen(link)
parser = URLLister()
parser.feed(usock.read())
parser.close()
usock.close()
for url in parser.urls: print url
except:
print "aucun resultats, reesayez avec un autre Url..."+ sys.argv[1]+ " !"
Sources de la même categorie
Commentaires et avis
Discussions en rapport avec ce code source dans le forum
Surveiller les échanges sur internet [ par aera group ]
Bonjour,Je souhaite développer un petit programme de contrôle d'Interent sur un PC (comme pour faire un logiciel de contrôl parental par exemple). J'a
serveur local redirigé vers page web [ par alix20 ]
Bojour à tous,voilà, je suis complètement débutante en python (je découvre python grace à Swinnen) et j'ai une question qui semblera peut-être ridicul
Ouvrir une page web avec mozilla avec python [ par Shakan972 ]
Bonsoir tout le monde je souhaiterais savoir la manière d'ouvrir une page web à l'aide de python et cela sous mozilla.Je sais en effet que la commande
python ou php ? [ par eric35 ]
Salut J' hésite entre ces 2 langages ...Avant de choisir l'un ou l 'autre, pouvez vous me donner à titre d 'exemple, quel serait le code pour lancer
Modifier titre page html [ par miniimoi ]
Bonjour,je dois créer un proxy en python pour un projet et il faut que je recupere le titre de la page html et le modifier.Je suis novice dans ce doma
conversion de code python [ par gortex3D ]
Hello tout le monde Je viens ici demander de l'aide. Je programme un petit peu en windev mais je ne connais pas d'autres language de programmation à
probleme avec karrigell [ par majiddus ]
bonjour je suis debutant en python,dans le but d'heberger un site web, j'ai installé le serveur karrigell,a partir de mon resau local tout marche bien
Comment ouvrir une page web? [ par tipro75 ]
Comment peut-on ouvrir un fichier (text dans ce cas(format html dans ce cas)) sur internet exemple :je veut lire une page toute les 1 minute pour voir
Comment fair un robot qui puisse fair des des actions sur internet ? [ par tipro75 ]
Bonjour, esque qu'el qu'un sait Comment fair un robot qui puisse fair des des actions sur internet ? merci d'avance cordialement ********.
Connexion internet (je n'arrive pas à ouvrir Internet Explorer) [ par atoutcoeur13 ]
Bonjour à toutes et tous, J'ai un soucis de connexion et j'aimerais avoir une réponse assez rapide.Voilà!La fille de ma copine a r
|
Derniers Blogs
[WP7] AJOUTER DES IMAGES DANS LA MEDIA LIBRARY D'UN WINDOWS PHONE 7[WP7] AJOUTER DES IMAGES DANS LA MEDIA LIBRARY D'UN WINDOWS PHONE 7 par Audrey
L'émulateur Windows Phone 7, fourni avec la version Beta des outils développeurs n'inclut aucune image dans sa bibliothèque. Pas très pratique de tester son application lorsque l'on souhaite que l'utilisateur puisse choisir une image présente dans le télé...
Cliquez pour lire la suite de l'article par Audrey VIVE LES MOCKS ET LES POCOSVIVE LES MOCKS ET LES POCOS par vLabz
J'observe régulièrement autour de moi de la confusion à propos de ces deux termes et j'aimerais juste rappeler ce qu'ils signifient. Je ne suis bien sûr pas le mieux placé pour faire une leçon mais je vais faire de mon mieux pour mettre en valeur ce q...
Cliquez pour lire la suite de l'article par vLabz [WF4] WORKFLOW AND CUSTOM ACTIVITIES - BEST PRACTICES (4/5)[WF4] WORKFLOW AND CUSTOM ACTIVITIES - BEST PRACTICES (4/5) par JeremyJeanson
Vendredi dernier Microsoft a publié le quatrième épisode des bonnes pratiques pour coder ses activités custom dans WF4 : endpoint.tv - Workflow and Custom Activities - Best Practices (Part 4) . Tout comme pour les précédents épisodes, j'ai pris le temps d...
Cliquez pour lire la suite de l'article par JeremyJeanson DéVELOPPEMENT MOBILE : .NET COMPACT FRAMEWORK & LIMITATIONSDéVELOPPEMENT MOBILE : .NET COMPACT FRAMEWORK & LIMITATIONS par Pi-R
Introduction :
Le développement d'applications mobiles est quelque peu différent du développement d'applications sous Windows. En effet, le développement d'applications mobiles se base sur le .NET Compact Fra...
Cliquez pour lire la suite de l'article par Pi-R IPHONE VERSUS WP7 CODINGIPHONE VERSUS WP7 CODING par Nicolas
Je relais une présentation sur slideshare.net, qui compare le développement sur Iphone et Windows Phone 7, qui ma fait sourire. I phone versus windows phone 7 coding View more presentations from www.donburnett.com. J'aurais bien aimé une comparai...
Cliquez pour lire la suite de l'article par Nicolas
Logiciels
Xilisoft HD Vidéo Convertisseur 6 (6.0.3.0421)XILISOFT HD VIDéO CONVERTISSEUR 6 (6.0.3.0421)Xilisoft HD Vidéo Convertisseur est un outil professionnel de conversion HDTV, conçu pour transfo... Cliquez pour télécharger Xilisoft HD Vidéo Convertisseur 6 Xilisoft MP4 Convertisseur 6 (6.0.2.0415)XILISOFT MP4 CONVERTISSEUR 6 (6.0.2.0415)Xilisoft MP4 Convertisseur est un outil puissant pour la conversion de vidéo MP4, qui peut conver... Cliquez pour télécharger Xilisoft MP4 Convertisseur 6 Vade Retro Desktop (3.03)VADE RETRO DESKTOP (3.03)Le logiciel antispam Vade Retro pour Microsoft Outlook®, Outlook Express® et Windows Mail®(Vista)... Cliquez pour télécharger Vade Retro Desktop Malwarebytes Anti Malwares (1.46)MALWAREBYTES ANTI MALWARES (1.46)Malwarebytes' Anti-Malware est un anti-malware qui peut éliminer même les plus avancés des logic... Cliquez pour télécharger Malwarebytes Anti Malwares
|