X ray

X ray

Readme.md

Installation

Caractéristiques

schéma flexible: Prise en charge de chaînes, des tableaux, des tableaux d’objets et structures d’objets imbriquées. Le schéma ne soit pas lié à la structure de la page que vous grattage, vous permettant d’extraire les données dans la structure de votre choix.

composables: L’API est entièrement composable, vous donnant une grande souplesse dans la façon dont vous grattez chaque page.

soutien Pagination: Paginer par les sites web, en grattant chaque page. X-ray supporte également un retard de demande et une limite de pagination. pages grattées peuvent être écoutés dans un fichier, donc s’il y a une erreur sur une page, vous ne perdrez pas ce que vous avez déjà gratté.

support de chenilles: Commencer sur une page et passer à la prochaine facilement. Le flux est prévisible, à la suite d’une exploration en largeur d’abord à travers chacune des pages.

Responsable: X-ray a le soutien de la concurrence, des étranglements, des retards, des délais d’attente et les limites pour vous aider à gratter une page de façon responsable.

conducteurs enfichables: Swap dans différents racloirs en fonction de vos besoins. soutient actuellement les pilotes du pilote HTTP et PhantomJS. Dans l’avenir, je voudrais voir un pilote Tor pour demander pages à travers le réseau Tor.

API de sélection

xray (url, sélecteur) (fn)

Grattez l’URL pour le sélecteur suivant. retourner un objet dans la fn de rappel. Le sélecteur prend une chaîne jQuery comme amélioré qui est également en mesure de sélectionner des attributs. La syntaxe pour la sélection des attributs est sélecteur @ attribut. Si vous ne fournissez pas un attribut, la valeur par défaut est de sélectionner le innerText.

Voici quelques exemples:

vous pouvez également commander ici.

Vidéo pour vous:


Read more

You May Also Like

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *