Accueil > > > ASPIRATEUR D' URLS DANS LE CODE HTML D'UNE PAGE WEB
ASPIRATEUR D' URLS DANS LE CODE HTML D'UNE PAGE WEB
Information sur la source
Description
tout est dans le titre, ce code est simple il cherche les urls dans le code source d' une page internet spécifiée.
Source
- #Importation de la lib pour utiliser la classe URLLister
- from sgmllib import SGMLParser
- import sys
-
- if len(sys.argv) != 2:
- print "\n\n****************************************************"
- print "Aspirateur d' URL dans une Page web !!! "
- print "********************************************************"
- print "\nUsage : ./aspy.py <page_web> "
- print "ex: ./aspy.py http://www.exemple.com "
- print "\n******************************************************"
- sys.exit(1)
-
-
- # classe qui va nous servir a chercher les URLS dans la page web.
- class URLLister(SGMLParser):
- def reset(self):
- SGMLParser.reset(self)
- self.urls = []
-
- def start_a(self, attrs):
- href = [v for k, v in attrs if k=='href']
- if href:
- self.urls.extend(href)
-
- if __name__ == "__main__":
-
- import urllib
- print "\n##########################################################"
- print "# #"
- print "# ASPY-1.0 By tOnyH2 JfF #"
- print "# contact : grunt_tony@hotmail.fr #"
- print "# #"
- print "##########################################################\n"
- link = sys.argv[1]
- try:
- usock = urllib.urlopen(link)
- parser = URLLister()
- parser.feed(usock.read())
- parser.close()
- usock.close()
- for url in parser.urls: print url
- except:
- print "aucun resultats, reesayez avec un autre Url..."+ sys.argv[1]+ " !"
-
#Importation de la lib pour utiliser la classe URLLister
from sgmllib import SGMLParser
import sys
if len(sys.argv) != 2:
print "\n\n****************************************************"
print "Aspirateur d' URL dans une Page web !!! "
print "********************************************************"
print "\nUsage : ./aspy.py <page_web> "
print "ex: ./aspy.py http://www.exemple.com "
print "\n******************************************************"
sys.exit(1)
# classe qui va nous servir a chercher les URLS dans la page web.
class URLLister(SGMLParser):
def reset(self):
SGMLParser.reset(self)
self.urls = []
def start_a(self, attrs):
href = [v for k, v in attrs if k=='href']
if href:
self.urls.extend(href)
if __name__ == "__main__":
import urllib
print "\n##########################################################"
print "# #"
print "# ASPY-1.0 By tOnyH2 JfF #"
print "# contact : grunt_tony@hotmail.fr #"
print "# #"
print "##########################################################\n"
link = sys.argv[1]
try:
usock = urllib.urlopen(link)
parser = URLLister()
parser.feed(usock.read())
parser.close()
usock.close()
for url in parser.urls: print url
except:
print "aucun resultats, reesayez avec un autre Url..."+ sys.argv[1]+ " !"
Sources de la même categorie
Commentaires et avis
Discussions en rapport avec ce code source dans le forum
Surveiller les échanges sur internet [ par aera group ]
Bonjour,Je souhaite développer un petit programme de contrôle d'Interent sur un PC (comme pour faire un logiciel de contrôl parental par exemple). J'a
serveur local redirigé vers page web [ par alix20 ]
Bojour à tous,voilà, je suis complètement débutante en python (je découvre python grace à Swinnen) et j'ai une question qui semblera peut-être ridicul
Ouvrir une page web avec mozilla avec python [ par Shakan972 ]
Bonsoir tout le monde je souhaiterais savoir la manière d'ouvrir une page web à l'aide de python et cela sous mozilla.Je sais en effet que la commande
python ou php ? [ par eric35 ]
Salut J' hésite entre ces 2 langages ...Avant de choisir l'un ou l 'autre, pouvez vous me donner à titre d 'exemple, quel serait le code pour lancer
Modifier titre page html [ par miniimoi ]
Bonjour,je dois créer un proxy en python pour un projet et il faut que je recupere le titre de la page html et le modifier.Je suis novice dans ce doma
conversion de code python [ par gortex3D ]
Hello tout le monde Je viens ici demander de l'aide. Je programme un petit peu en windev mais je ne connais pas d'autres language de programmation à
probleme avec karrigell [ par majiddus ]
bonjour je suis debutant en python,dans le but d'heberger un site web, j'ai installé le serveur karrigell,a partir de mon resau local tout marche bien
Comment ouvrir une page web? [ par tipro75 ]
Comment peut-on ouvrir un fichier (text dans ce cas(format html dans ce cas)) sur internet exemple :je veut lire une page toute les 1 minute pour voir
Comment fair un robot qui puisse fair des des actions sur internet ? [ par tipro75 ]
Bonjour, esque qu'el qu'un sait Comment fair un robot qui puisse fair des des actions sur internet ? merci d'avance cordialement ********.
Connexion internet (je n'arrive pas à ouvrir Internet Explorer) [ par atoutcoeur13 ]
Bonjour à toutes et tous, J'ai un soucis de connexion et j'aimerais avoir une réponse assez rapide.Voilà!La fille de ma copine a r
|
Derniers Blogs
CSS CONTENT STATE SELECTORS (PERSONNAL DRAFT)CSS CONTENT STATE SELECTORS (PERSONNAL DRAFT) par FREMYCOMPANY
Bonjour à tous, Je viens de publier une proposition comprenant 5 pseudo-classes pour le CSS Working Group ayant trait à l'état de chargement d'un élément (ex: IMG,VIDEO,AUDIO,OBJECT pour l'HTML.). Si le c½ur vous en dit, vous pouvez retrouver cette p...
Cliquez pour lire la suite de l'article par FREMYCOMPANY MBA : POURQUOI FAIRE ET COMMENT LE CHOISIR ?MBA : POURQUOI FAIRE ET COMMENT LE CHOISIR ? par ROMELARD Fabrice
Formation initiale Durant la formation, le découpage classique est le suivant (je donnerai les équivalences Suisse lorsque je les connaîtrais) : Ecole primaire jusqu'au Collège : Formation générale permettant d'obtenir les méthodes...
Cliquez pour lire la suite de l'article par ROMELARD Fabrice Y'A DES ERREURS QUI PEUVENT RENDRE LE DéVELOPPEUR VIOLENTY'A DES ERREURS QUI PEUVENT RENDRE LE DéVELOPPEUR VIOLENT par Aleks
Quand on a ce genre d'erreur sans log :
Et bas on a juste envie de choper le gas de Microsoft qu'a développé ça et lui foutre des baffes de Coboye ! ...
Cliquez pour lire la suite de l'article par Aleks [HYPER-V 3] PRéSENTATION DES COMMANDLETS POWERSHELL[HYPER-V 3] PRéSENTATION DES COMMANDLETS POWERSHELL par Pierrick CATRO-BROUILLET
Avec la sortie prochaine de la Beta Consumer Preview de Windows 8, j'avais envie de revenir sur une des fonctionnalités que j'attends le plus et que, en bon geek que je suis, j'utilise déjà : Hyper-V 3 ainsi son module PowerShell.
Il y a déjà pléthor...
Cliquez pour lire la suite de l'article par Pierrick CATRO-BROUILLET IIS7 - COMPRESSION GZIPIIS7 - COMPRESSION GZIP par cyril
La compression GZIP permet d'améliorer les performances de navigation en compressant ce qu'envoie le serveur à un client. Pour comprendre comment cela fonctionne, regardons ce qu'il se passe au niveau HTTP lorsqu'un client tente d'accéder à une ress...
Cliquez pour lire la suite de l'article par cyril
Forum
PYVISA PROBLèMEPYVISA PROBLèME par sandrine44
Cliquez pour lire la suite par sandrine44
Logiciels
Easy-Planning (1.0.0.1)EASY-PLANNING (1.0.0.1)Basé sur les mêmes principes que MyPlanning, Easy-Planning permet de créer des plannings sous la ... Cliquez pour télécharger Easy-Planning Academy System (17.1.3.0)ACADEMY SYSTEM (17.1.3.0)Logiciel de gestion des établissements.
- élèves/étudiants (inscription, dossier, absence...)
-... Cliquez pour télécharger Academy System COLLECTOR PLUS (3.00B)COLLECTOR PLUS (3.00B)COLLECTOR PLUS version 3.00B est un logiciel utilisant une base de données alimentée par :
- L... Cliquez pour télécharger COLLECTOR PLUS PONAMEDIA PREMIUM - HELLLOOO FLASH DEMO (V7.4)PONAMEDIA PREMIUM - HELLLOOO FLASH DEMO (V7.4)PONAMEDIA TV DEVIENS HELLLOOO FLASH
LA TV SUR VOTRE ORDINATEUR.
Toute une plateforme Multi... Cliquez pour télécharger PONAMEDIA PREMIUM - HELLLOOO FLASH DEMO LettresFaciles 2011 (8.0.0.1)LETTRESFACILES 2011 (8.0.0.1)LettresFaciles est un logiciel facilitant la création et la rédaction de lettres types.
Son inte... Cliquez pour télécharger LettresFaciles 2011
|