Christophe Casalegno

Trouver des leads qualifiés grace au langage bash sous linux

Hello les amis, vous êtes nombreux, à savoir que j’utilise le langage bash quotidiennement. Beaucoup imaginent que c’est parce que je fais essentiellement de l’administration système GNU / Linux, mais ils se trompent… J’utilise le bash quotidiennement dans des contextes très différents.

Démonstration

stackx lead sciences

Il y a quelques jours, j’ai annoncé sur plusieurs réseaux comme LinkedIn que j’allais contacter des entreprises évoluant dans le domaine scientifique pour leur proposer une offre managée exclusive.

L’idée commerciale / marketing est de systématiquement « surclasser » les offres vers leur niveau supérieur. Je pourrais vous expliquer pourquoi j’ai une appétence personnelle particulière pour les sociétés qui évoluent dans ce domaine, mais ceci est un autre sujet :)

Pour ce faire, je pourrais commencer par acheter un fichier de contacts spécialisé. Cependant, cela m’obligerait à contacter beaucoup trop d’entreprises alors qu’une fraction d’entre elles sont réellement concernées par cette offre.

Voici donc comment je procède avec le bash :

1) Je fais le miroir local d’un annuaire en ligne spécialisé qui référence un type d’entreprise pour lequel j’ai un intérêt commercial :

wget --mirror --convert-links --adjust-extension --page-requisites --no-parent --domains monexemple.com https://www.monexemple/

Après un examen rapide d’une page, j’extrais de l’ensemble des pages la liste de liens qui m’intéressaient :

2024-09-22 15:40:45 for i in $(ls) ; do grep -r '<a href="../liens' $i | head -n 1 | cut -d '/' -f2 | cut -d " " -f2 | sed 's/target="_blank">//g' | sed 's/<//g'; done | sort -u > ../../cible1.txt

Je dresse ensuite une nouvelle liste de tous ceux qui utilisent les logiciels ou les langages qui m’intéressent. Par exemple, si je souhaite obtenir la liste de tous ceux qui utilisent WordPress :

15:54:02-brain@mcp:~/Work/leadscience$ for site in $(cat cible1.txt); do response=$(curl -s "https://$site"); if echo "$response" | grep -q "wp-content"; then echo "$site: OK"; else echo "$site: ERROR"; fi; done > cibleswp.txt

La suite ? Je vais probablement dresser une liste des services d’hébergement utilisés pour chaque site concerné (hébergeur, pays, type d’offre : serveur ou mutualisé, etc.). Un simple whois sur les adresses IP me donnera l’essentiel de ces informations.

Résultat : avec quelques lignes de commande, j’ai pu obtenir exactement la liste des entreprises qui répondent à mes critères, sans gaspiller de ressources, ni le temps et l’argent des sociétés qui ne seraient pas concernées par cette offre (comme le mien).

Bien entendu, vous pouvez faire la même chose avec votre langage préféré.

Si le sujet vous intéresse, dites-le-moi en commentaire. Je serais ravi de partager d’autres situations où j’utilise Bash en dehors de l’administration système.

Je vous invite également à me raconter vos expériences avec des langages en dehors de leur « zone de confort » :) Bonne fin de week-end !

Vous pouvez me suivre sur : Telegram | YouTube | Twitter | Facebook | LinkedIn | Twitch

2 Commentaires

  1. Hello Christophe,

    Qu’entends-tu par « L’idée commerciale / marketing est de systématiquement « surclasser » les offres vers leur niveau supérieur. » ?

    Merci pour cette précision

    • Hello Nicolas, dans l’exemple de StackX, on propose 3 offres : Basic (145 € /mois), Advance (290 €) et Premium (580 €). Je surclasse les clients qui œuvrent dans le domaine scientifique (ils vont, par exemple, payer 145 € /serveur, mais disposeront dans la pratique du niveau de service de l’offre supérieure).

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *