Documentation

Introduction | Crawler | Indexer | Scanner | Scoring | Flux RSS | Tracking | Régie Publicitaire | Revendiquer son site internet |

Introduction

Il y a tellement de sites internet qu'il devient très difficile de s'y retrouver

Dès lors que l'on a un site internet : la problématique c'est de le faire connaitre et d'avoir des visiteurs

C'est le problème de tout le monde qui a un site internet.

Et il y a maintenant tellement de sites internet que cela devient très difficile de se connaitre

Les principales problématiques

Comment faire connaitre son site Internet ?

Comment faire connaitre son site internet ?

Petit jeu : tu sais que JNH édite un logiciel mais comment trouver son site Internet ?

Comment savoir d'ou viennent mes visiteurs ?

On a aussi l'impression de voir et revoir les memes sites internet lors d'une recherche internet

C'est comme si le moteur de recherche ne tenait pas compte des sites que l'on a déjà visité pour nous en proposer de nouveaux.

Il n'y a pas vraiment d'annuaire public des sites web et tout le monde utilise le meme moteur de recherche

Plutot que d'avoir systèmatiquement les memes sites (comme huffingtonpost ou booking) : L'idée est de mettre en avant les différents sites Internet.

De commencer la nabigation par la page d'accueil du site internet : c'est comme rentrer dans une maison par la porte d'entrée plutot que par une fenetre (cela parait naturel)

Comment capter de nouveaux sites Internet ?

  1. Tester toutes les combinaisons de nom de domaine (DNSTEST).
  2. Détecter les liens vers les autres sites lors de l'analyse d'un site Internet.
  3. Annalyser les pages lors de la navigation des utilisateurs (Extension Chrome) de détection de nouveaux sites Internet.
  4. Ajout manuel et gratuit d'un nom de domaine dans la base de données depuis le site Internet.

Proposer l'audit gratuit d'un site internet

Es-ce important d'avoir tous les noms de domaine ?

Non cela n'empeche en rien de mettre en avant certains sites qui le souhaite

Quels sont les scores de tri ?

  1. Les plus / moins visités
  2. Les mieux scorés selon l'algorithme de Wopa!
  3. Les mieux / moins bien notés par les internautes
  4. Les plus / moins nouveaux par rapport à la détection d'ajout dans la base de données

Autocomplete

L'objectif de l'autocomplete est de proposer / suggérer des recherches au fur et a mesure que l'utilisateur tape les lettres de sa recherche.

Crawler

L'objectif du crawler est de parcourir les pages webs des sites à la recherche de nouveaux sites web.

Développé en c# sous visual studio 2019, c'est un programme multithread qui gère un traitement parallele qui peut etre déployé sur différentes machines

Pour se faire il analyse chaque page et chaque lien des sites web.

Si le nom de domaine est différent du nom de domaine du site web analysé alors il le soumet à la bas de données comme nouveau nom de domaine.

DNSTest

DNSTest permet de rechercher des noms de domaines en testantant toutes les combinaisons possibles... c'est long mais efficace pour les petits noms de domaines de quelques caractères.

Scanner

L'objectif du scanner est d'extraire des pages web les données interessantes que sont le titre de la page, les balises meta description et mots clés aisni que l'encodage de la page et mots du contenu de la page.

Indexer

L'objectif de l'indexer est de créer un index par rapport aux mots clés du site web.

Géolocalisation des visiteurs

L'objectif est d'identifier la localisation du visiteur. France, Europe, Etats Unis afin de determiner la langue par défaut.

Scoring

L'objectif est de déterminer quelles sont les meilleurs résultats à présenter suivant la recherche.

Analyse de site web

Extension Chrome

L'extension Chrome permet d'ajouter des messages depuis le navigateur Internet Chrome

Tracking

L'objectif du Tracking est de mesurer l'audiance au niveau du moteur de recherche.

Le principe est d'afficher une image sur chaque page qui va mesurer l'activité du visiteur ainsi que les parametres de son navigateur internet.

La balise <img> et le javascipt se présentent sous cette forme :

<img id="balise" style="border:0px solid black;padding-top:15px;">

("#balise").attr("src",'/wopa_marqueur.asp?origin=https%3A%2F%2Fwww%2Ewopa%2Efr%2F&loc='+ encodeURI(location.href) +'&vendor=°+ navigator.vendor +°&language='+ navigator.language +'&res='+ screen.width +'x'+ screen.height +'|'+ screen.colorDepth );</script>

Base de données utilisée : STATS

Nom de la TABLE : stats

Exemple de données :

id1100820
stat18/10/2024 05:56:51
http_user_agentMozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; bingbot/2.0; +http://www.bing.com/bingbot.htm) Chrome/112.0.0.0 Safari/537.36
http_refererhttps://wopa.fr/popunder
remote_addr40.77.189.246
remote_host40.77.189.246
paramsorigin=&loc=https://wopa.fr/popunder&vendor=%C2%B0+%20navigator.vendor%20+%C2%B0&language=en-US&res=800x600|24
sessionid941923109
resolution800x600|24
origin
cookie{4EE115EE-F55D-47B3-8111-904346A7A4DE}
vendor° navigator.vendor °
lochttps://wopa.fr/popunder

Régie publicitaire

La régie publicitaire permet de passer des annonces avec un positionnement payant au CPC (Cout Par Clic).

Le plus offrant se retrouve le mieux positionné selon la cible de ses mots clés. (voir cet exemple : Astronomie) (il devrait y avoir des annonces)

C'est un nouveau "terrain de jeu" permettant aux premiers arrivés d'avoir les meilleurs opportunités

A ce jour, se positionner sur "Hôtel Paris" ne coute que 1 centime par clic

Les impressions des annonces sont gratuites

Pour éviter que des concurrents viennent cliquer sur vos annonces, une seule adresse ip est facturée par clic par semaine. et vous avez la possibilité de désactiver des adresses ip suspectes (à coder)

Pas de notion de budget quotidien : Tant que l'on a du budget et qu'il y a des visiteurs l'annonce s'affiche

On n'a pas la mauvaise surprise de voir son annonce disparaitre à 9h du matin car le budget quotidien est consommé

Qu'es-ce qui empeche de faire de la publicité sur des mots clés sans rapport avec l'annonce ?

Peut on faire de la publicité sur tous les mots clés possibles ?

Idée : Prévoir la modération des annonces avant affichage sur le site !

Idée : Prévoir des alertes sur les mots clés !

Idée d'amélioration : Développer une IA pour une affectation automatique du budget !

Principales améliorations ?

Quelles sont les principales améliorations avant de pouvoir communiquer sur le site ?

  1. Plus aucun bug dans les interfaces (redirections, budget, update etc...)
  2. Améliorer le responsive design du site
  3. Accélerer les temps de réponses des recherches
  4. Monter une structire (société)
  5. Charte graphique (mieux)
  6. Avoir un maximum de sites Internet (les nouveaux)