- #Importation de la lib pour utiliser la classe URLLister
- from sgmllib import SGMLParser
- import sys
-
- if len(sys.argv) != 2:
- print "\n\n****************************************************"
- print "Aspirateur d' URL dans une Page web !!! "
- print "********************************************************"
- print "\nUsage : ./aspy.py <page_web> "
- print "ex: ./aspy.py http://www.exemple.com "
- print "\n******************************************************"
- sys.exit(1)
-
-
- # classe qui va nous servir a chercher les URLS dans la page web.
- class URLLister(SGMLParser):
- def reset(self):
- SGMLParser.reset(self)
- self.urls = []
-
- def start_a(self, attrs):
- href = [v for k, v in attrs if k=='href']
- if href:
- self.urls.extend(href)
-
- if __name__ == "__main__":
-
- import urllib
- print "\n##########################################################"
- print "# #"
- print "# ASPY-1.0 By tOnyH2 JfF #"
- print "# contact : grunt_tony@hotmail.fr #"
- print "# #"
- print "##########################################################\n"
- link = sys.argv[1]
- try:
- usock = urllib.urlopen(link)
- parser = URLLister()
- parser.feed(usock.read())
- parser.close()
- usock.close()
- for url in parser.urls: print url
- except:
- print "aucun resultats, reesayez avec un autre Url..."+ sys.argv[1]+ " !"
-
#Importation de la lib pour utiliser la classe URLLister
from sgmllib import SGMLParser
import sys
if len(sys.argv) != 2:
print "\n\n****************************************************"
print "Aspirateur d' URL dans une Page web !!! "
print "********************************************************"
print "\nUsage : ./aspy.py <page_web> "
print "ex: ./aspy.py http://www.exemple.com "
print "\n******************************************************"
sys.exit(1)
# classe qui va nous servir a chercher les URLS dans la page web.
class URLLister(SGMLParser):
def reset(self):
SGMLParser.reset(self)
self.urls = []
def start_a(self, attrs):
href = [v for k, v in attrs if k=='href']
if href:
self.urls.extend(href)
if __name__ == "__main__":
import urllib
print "\n##########################################################"
print "# #"
print "# ASPY-1.0 By tOnyH2 JfF #"
print "# contact : grunt_tony@hotmail.fr #"
print "# #"
print "##########################################################\n"
link = sys.argv[1]
try:
usock = urllib.urlopen(link)
parser = URLLister()
parser.feed(usock.read())
parser.close()
usock.close()
for url in parser.urls: print url
except:
print "aucun resultats, reesayez avec un autre Url..."+ sys.argv[1]+ " !"