• STATISTIQUES
  • Il y a eu un total de 0 membres et 45823 visiteurs sur le site dans les dernières 24h pour un total de 45 823 personnes!
    Membres: 2 605
    Discussions: 3 579
    Messages: 32 816
    Tutoriels: 78
    Téléchargements: 38
    Sites dans l'annuaire: 58


  • ANNUAIRE
  • [EN] Reddit
    Subreddit dédié à la sécurité informatique.
    Hacking
    [EN] Net Force
    Javascript: 9, Java Applets: 6, Cryptography: 16, Exploits: 7, Cracking: 14, Programming: 13, Internet: 15, Steganograph...
    Challenges
    [FR] Zmaster
    Articles sur l'informatique, le hacking, le P2P, les divx, les astuces windows XP, les GSM, Emule, la cryptograph...
    Hacking
    [FR] Root-Me
    Notre équipe se base sur un constat : à l'heure actuelle ou l'information tend à devenir...
    Hacking
    [EN] Astalavista
    JavaScript: 1, Exploit: 2, Crypto: 34, CrackIt: 15, Stegano: 8, Programming: 12, Logic: 36, Special: 6, Science: 4, Info...
    Challenges
    [FR] PHP France
    Pour tout savoir sur le PHP, en français. Vous trouverez des tutoriels, des exemples, des astuces, toute la do...
    Hacking
    [EN] PHPFreaks
    PHPFreaks est un site dédié à l'apprentissage et l'enseignement du PHP. Ici vous trouver...
    Programmation

  • DONATION
  • Si vous avez trouvé ce site internet utile, nous vous invitons à nous faire un don du montant de votre choix via Paypal. Ce don servira à financer notre hébergement.

    MERCI!




Note de ce sujet :
  • Moyenne : 0 (0 vote(s))
  • 1
  • 2
  • 3
  • 4
  • 5
[Python] Aspirateur de dossier
19-12-2011, 15h40 (Modification du message : 19-11-2012, 19h04 par InstinctHack.)
Message : #1
Dobry Hors ligne
Tueur de lamouz
*



Messages : 206
Sujets : 25
Points: 73
Inscription : Aug 2011
[Python] Aspirateur de dossier
En voyant le poste de Nowz je me suis souvenu d'un tool python que j'avais fait il y à quelques temps pour aspirer le repo d'un site (hackbbs pour ne pas le citer), et j'en profite pour le partager ici.
Bien sûr le code n'est pas forcément portable, étant donnée que chaque site ou page à une structure différente, mais il reste fonctionnel et modifiable (ce code fonctionne également pour les dossiers sans index sur un site par exemple).
Attention, le script télécharge tous les documents et sous dossiers.

Code :
#coding=utf-8


import urllib, urllib2, re, argparse, os, sys


def scan(path):
  print 'Debut scan ' + path
  dossier = 0
  requete = urllib2.Request(path)
  page = urllib2.urlopen(requete).read()
  variable =  re.findall('\<a href="(.+?)"', page)
  for i in variable:
    if i[0] != '/':
      try:
    urllib.urlretrieve(path+i, i)
    print 'Telechargement de : ' + i
      except IOError as (strerr, strer):
    if strer == 'Is a directory':
      dossier+=1
      print path + i
      try:
        os.mkdir(i)
      except:
        print 'Existe deja'
      os.chdir(i)
      scan(path + i)
  os.chdir('../')
  if dossier == 0:
    return

    
      
      
if __name__ == "__main__":      
  parser = argparse.ArgumentParser(description='Aspirer un dossier')
  parser.add_argument('url', action="store", help="URL a aspirer")
  args = parser.parse_args()
  arguments = dict(args._get_kwargs())

  scan(arguments['url'])

Necromoine
Aestuārium Erudītiōnis

There are only two hard things in Computer Science: cache invalidation, naming things, and off-by-one errors.
+1 (0) -1 (0) Répondre
19-12-2011, 15h42
Message : #2
CyberSee Hors ligne
Admin fondateur de N-PN
*******



Messages : 1,721
Sujets : 287
Points: 157
Inscription : Jan 2012
[Python] Aspirateur de dossier.
Bravo warezz très bon petit bout de code. Merci du partage.
Moi j'ai utiliser WinHttrack pour aspirer les différents repo.
+1 (0) -1 (0) Répondre
19-12-2011, 15h56
Message : #3
Dobry Hors ligne
Tueur de lamouz
*



Messages : 206
Sujets : 25
Points: 73
Inscription : Aug 2011
[Python] Aspirateur de dossier.
Merci !!
Oui WinHttrack est bien mais un peu lourd je trouve et puis j'aime bien le faire à la main Big Grin
Aestuārium Erudītiōnis

There are only two hard things in Computer Science: cache invalidation, naming things, and off-by-one errors.
+1 (0) -1 (0) Répondre
16-01-2012, 22h21
Message : #4
naax Hors ligne
Banni



Messages : 8
Sujets : 1
Points: 0
Inscription : Jan 2012
[Python] Aspirateur de dossier.
mais à ce moment la, tous le monde peut avoir notre config.php avec les authentification?
merci de vos réponse.
+1 (0) -1 (0) Répondre
29-02-2012, 19h46
Message : #5
Dobry Hors ligne
Tueur de lamouz
*



Messages : 206
Sujets : 25
Points: 73
Inscription : Aug 2011
RE: Aspirateur de dossier.
Naax, non Big Grin Le php est exécuté coté serveur, ce que permet de faire le script présent c'est juste télécharger les pages que tu visionnerais à travers un navigateur, mais il fait ca tout seul, donc plus simple.
Aestuārium Erudītiōnis

There are only two hard things in Computer Science: cache invalidation, naming things, and off-by-one errors.
+1 (0) -1 (0) Répondre


Sujets apparemment similaires…
Sujet Auteur Réponses Affichages Dernier message
  [Python]Situer mon niveau. InforMods 19 1,047 10-11-2016, 00h03
Dernier message: ZeR0-@bSoLu
  [PYTHON] un bot IRC basique darcosion 1 156 13-06-2016, 20h40
Dernier message: Yttrium
  [python] ANBU ::: TCP Session Hunter St0rn 2 242 25-02-2016, 18h45
Dernier message: otherflow
  [Python] Une autre façon de gérer les Virtualenv et Packages thxer 2 138 18-01-2016, 12h06
Dernier message: thxer
  [Python] rot script ark 9 482 08-03-2015, 00h37
Dernier message: ark
  [Python] Todo Manager ark 5 373 03-03-2015, 10h55
Dernier message: ark
  [python] Un décorateur pour inventorier les objets b0fh 1 170 04-12-2014, 17h50
Dernier message: thxer
  [python] UPnP Scanner St0rn 2 197 29-10-2014, 14h50
Dernier message: St0rn
  [python] Buffer Overflow : EBP et EIP St0rn 0 132 25-10-2014, 12h58
Dernier message: St0rn
  [Python] QuickHex thxer 9 470 15-08-2014, 20h26
Dernier message: sakiir

Atteindre :


Utilisateur(s) parcourant ce sujet : 2 visiteur(s)
N-PN
Accueil | Challenges | Tutoriels | Téléchargements | Forum | Retourner en haut