Filtre spammeur
Technologies du logiciel antispam
Il existe un très grand nombre de techniques antispams, dont certaines sont très récentes, comme le Greylisting et le Teergrubing. Voici une liste, la plus exhaustive possible, des techniques utilisées pour lutter contre les spams :
- Analyse lexicale (mots clefs et expressions) : L'analyse lexicale constitue un ensemble de règles représentées sous forme d'expressions régulières ou mots clefs. Elle permet de rechercher les mails dont les entêtes et/ou les corps des messages correspondent à des caractéristiques très particulières connues pour avoir une forte probabilité d'être un spam. Ces règles doivent être customisées afin d'identifier aussi bien les spams français qu'américains ou autres.
- Listes noires : Les RBL (Realtime Blackhole List) ou DNSBL (Back List DNS) sont des listes de serveurs ou de réseaux connus pour aider, accueillir, produire ou retransmettre des spams ou fournir un service pouvant être utilisé comme support pour l'expédition de spams : OpenSMTP Relay, Open Proxy List (OPL). Certaines de ces listes sont gratuites d'accès, d'autres nécessitent de souscrire à un abonnement payant.
- Conformité du protocole : Vérifie la conformité du protocole d'échange des emails avec les RFC 821 (SMTP) et RFC 1651 (ESMTP).
- Bases collaboratives de spams : Ces bases de signatures de spams sont utilisées de la même manière que les bases de signatures de virus. Elles sont alimentées par les utilisateurs de solutions antispams. Les bases les plus couramment utilisées sont : Razor, Distributed Checksum Clearinghouses (DCC) et Pyzor.
- Enregistrement DNS : Vérifie la corrélation entre l'adresse IP du serveur source et son nom via une requête DNS inverse (in-addr.arpa). Généralement, les véritables serveurs de messagerie possèdent une adresse IP fixe et bijective avec un nom de domaine associé. Malheureusement une grande quantité de serveurs ne possède pas d'enregistrement PTR dans les zones d'adresses pour lesquelles leurs fournisseurs sont autoritaires.
- Filtres bayésiens : Méthode probabiliste de filtrage des courriers électroniques fonctionnant par apprentissage et se basant sur la distribution statistique de mots clefs dans les mails. Ce type d'algorithme s'auto-adapte en s'appuyant sur l'analyse des emails connus comme étant ou n'étant pas des spams.
- Liste blanche : Liste de sites, hôtes, domaines ou adresses sûres. Par défaut très peu d'hôtes sont considérés comme sûrs car leurs adresses pourraient être usurpées par les spammeurs.
- Pondération par l’historique des transactions : il s'agit d'un système d'auto apprentissage des transactions effectuées entre un expéditeur et un destinataire. Cette technique permet généralement d'accélérer le temps de traitement des émetteurs déjà testés et considérés comme sûrs.
- Adresses URL : L'analyse des URL présentes dans le corps du message a pour but d'identifier et de filtrer le mail en fonction de l'action souhaitée (le click de l'utilisateur sur un lien promotionnel). Cette analyse est basée sur la détection de sites suspects et des url suspectes (numériques, mal formatées).
- Teergrubing : Technique permettant, par un maintien de session, de réduire significativement la vitesse de réponse du serveur SMTP sur certaines connexions considérées comme suspectes. Le teergrubing permet de bloquer temporairement les serveurs de spams afin de limiter toute réexpédition ultérieure.
- Greylisting : Le greylisting est une technique antispam récente qui consiste à rejeter temporairement un message, par émission d'un code de refus temporaire au serveur émetteur. Le serveur émetteur réexpédie le mail après quelques minutes, la plupart des serveurs de spams ne prennent pas cette peine !
- Sender Policy Framework (SPF), Caller-ID (Microsoft) ou Sender-ID (convergence de SPF et Caller-ID) sont des techniques ayant pour but d'identifier, pour un domaine donné, les hôtes autorisés à expédier des emails pour ce domaine. Concrètement cela s'effectue par la mise en place d'un identifiant particulier dans un champ TXT du domaine.
Toutes ces techniques comportent leurs avantages et leurs inconvénients, le greylisting par exemple ne génère aucun faux positif, les filtres bayésiens offrent des performances très intéressantes, après un temps d'apprentissage malheureusement important. La solution idéale ne consiste-t-elle pas à tirer partie de toutes ces techniques en les assemblant ? Il est préférable en terme de pertinence de résultat, et de réduction des faux positifs d'utiliser une combinaison de techniques antispam plutôt qu'une seule technique.
>>> Un logiciel antispam pour être efficace doit utiliser une combinaison de techniques antispam.
comparaison anti-spam spams spam ASP spammeur phishing bombing ASP anti-phishing mail mail spam spam courrier electronique spam smtp courrier electronique pourriel spammeur courrier electronique messagerie courrier electronique anti-virus mails logiciel antispam solution antispam ASP Blacklist virus filtre messagerie ASP malware
Qualité du logiciel antispam
Les critères de mesure de qualité des logiciels antispam sont : les taux de faux positifs et de faux négatifs. Le taux de faux positifs est le pourcentage de courriers électroniques légitimes identifiés à tort comme spams par la solution antispam mise en place. Le taux de faux négatifs est le pourcentage de spams interprétés par l'antispam comme étant des courriers électroniques légitimes.
Plus ces taux sont bas, plus la solution est performante. Un logiciel antispam efficace sera un système garantissant un faible taux de faux positifs et de faux négatifs. Malheureusement ces deux taux varient toujours de façon inversée. Il est relativement simple de développer une solution supprimant quasiment tous les spams, cependant des emails légitimes seront inévitablement interprétés comme des spams. Inversement, en réduisant au maximum le nombre de faux positifs, la quantité de spams détectés se trouvera également réduite !
Les faux positifs restent cependant un élément critique car ils peuvent correspondre à des emails légitimes importants, davantage préjudiciables. Il est donc naturel de privilégier au maximum la réduction du taux de faux positifs tout en essayant de conserver un bon niveau de détection de spams.
Étant donné que tous les logiciels antispam génèrent forcément des faux positifs, il convient également de proposer au client une alternative afin de se retourner en cas de faux positifs. Pour répondre à cette problématique, plusieurs techniques existent. Dans le cas d'une solution implémentée directement sur le poste de l'utilisateur, on trouvera souvent un dossier associé aux spams afin que l'utilisateur puisse lui-même analyser à posteriori le contenu de ce dossier. Dans le cas d'une solution implémentée du côté du serveur de messagerie, l'éditeur proposera soit une mise en quarantaine des spams, soit l'accès à un webmail contenant comme dans le premier cas un dossier spécifique aux spams.
>>> Un logiciel antispam doit réduire au maximum le taux de faux positif.
>>> Un logiciel antispam doit gérer les faux positifs : informer l'expéditeur et/ou le destinataire du message et récupérer le message bloqué.
comparatif anti-virus anti-spams spam Blacklist antivirus anti-scam spamming mail courrier electronique messagerie anti-scam Blacklist spamming anti-phishing filtre anti-spam anti-phishing antispam filtre pourriel anti-scam anti-scam email filtre antispam phishing antispam smtp spammeur scams antivirus scam logiciel antispam smtp malware
Les conséquences pour les victimes du spams mais aussi pour ses créateurs !
A première vue, le spam ne représente pas un énorme danger mais, il engendre une perte de temps considérable. Prenons pour exemple les publicités concernant des produits dont l’utilisateur n’a aucun besoin ou pour des sites de pornographie. En effet, la réception de spams augmente le temps passé par l’utilisateur à consulter, trier puis supprimer ses emails, au risque de supprimer des mails valables et importants.
Par contre pour ce qui est du mailbombing a nettement l'intention nuire ici la perte de temps s'additionne au risque de déni de service au niveau du serveur de messagerie visé et à la perte de données. Effectivement la majorité des fournisseurs d'accès ou d'adresses email gratuites décrètent une taille maximale pour les boîtes aux lettres. Et le mailbombing sature entièrement la capacité de la boîte de l’utilisateur ainsi les emails suivants sont perdus faute de stockage insuffisant.
Dans le cadre actuel de la législation française, le spammer encourt la fermeture ou la suspension sans préavis de son compte Internet par son fournisseur d'accès.
Quand aux entreprises, elles risquent de voir leur image de marque dégradée car le spamming est de nos jours très mal perçu. De plus, des sanctions plus sévères peuvent être envisagées lorsque le spamming est accompagné de faits répréhensibles (collecte déloyale de données personnelles ou la détention de bases de données illégales).
Dans le cas du mailbombing ou lorsque le spamming perturbe fortement le bon fonctionnement d'un équipement du réseau, le spammer peut faire l’objet de poursuites judiciaires sévères.
bombing logiciel antispam ASP email messagerie malware comparaison Blacklist antispam spamming ASP e-mail logiciel anti-spam antispam spamming anti-spam Blacklist ASP courrier electronique ASP mail anti-spams anti-scam malware anti-spams filtre antispam mails anti-pourriel scam scams Blacklist comparatif antivirus spam
Les différents types de courriers indésirables
Les spams sont des courriers électroniques indésirables, non sollicités aux contenus commerciaux qui créent une gêne lorsque ses destinataires le reçoivent.
Les notifications de serveurs (Mail Delivry message) sont des courriers électroniques envoyés automatiquement à l’émetteur pour le prévenir que son destinataire n'a pas reçu son courrier.
Les virus récent ont une exceptionnelle capacité à se diffuser en exploitant les failles de quelques logiciels de messagerie. Ainsi, ils enregistrent la liste des contacts des contaminés puis établissent leurs messages en croisant les adresses des émetteurs et des destinataires. Par conséquent, tout internaute faisant partie d’une liste de contacts contaminée, peut être, à son insu, émetteur et destinataire de spams et de virus. Et en quelques jours seulement, une boite aux lettres peut être submergée de messages automatiques par le simple fait d’avoir été inscrit de la liste des contacts d’une personne mal protégée.
Les virus à propagation automatique exploitent les listes de contacts des postes infectés. Ces virus à propagation automatique sont inclus dans un simple mail et il sont envoyés et réceptionnés par centaines de millions tous les jours. Ils peuvent être stoppés par les anti-virus or, il est courant que ce type de messages continu à se propager sans la signature du virus ou que la mise à jour n'arrive que 2 jours après la propagation, dans ce cas la messagerie est polluée d’emails inutiles.
Les scams sont des courriers électroniques dont le contenu offre une affaire attirante mais il s’agit en fait d'une arnaque. Ces emails proviennent dans la plupart des cas du Nigéria. Voici le scénario identique à chaque fois : on vous demande de l’aide pour sécuriser une somme d'argent importante en Europe ou en Amérique du nord, souvent sur votre compte. En remerciement de votre collaboration, une commission de l’ordre de 20% de la somme vous est reversée, et s'élève à plusieurs millions de dollars. Le piège réside dans le fait que cette somme n'existe absolument pas !
Le phishing est une technique en vogue. Celle-ci consiste à prendre l'apparence visuelle d'un service en ligne connu. Le but de la manœuvre est d’appâter un internaute réellement client du site copier. Le spam propose à l'internaute à se rendre sur le faux site pour qu’il procède à une mise à jour de certains renseignements personnels figurant dans un questionnaire également factice. L'internaute est donc trompé et laisse en toute confiance numéros de téléphone, de sécurité sociale, de compte bancaire et parfois de carte de crédit c'est-à-dire un ensemble d'informations lucratives pour les escrocs du web.
phishing scam mails malware antivirus scams Blacklist comparaison spamming spam anti-phishing anti-spam email filtre anti-spam virus antivirus spamming spams antivirus antispam messagerie scams logiciel anti-spam anti-scam e-mail smtp anti-scam mail courrier electronique Blacklist virus virus anti-scam ASP
Les thèmes fréquents des spams
On peut classer les spams suivant plusieurs thématiques, en voici des exemples :
Genre |
Contenu |
Types |
ADULTE |
Produits ou services destinés à des personnes ayant plus de 18 ans. |
Erotisme, Pornographie, Annonces Personnelles, Conseils matrimoniaux, ... |
FINANCIER |
Références ou offres liées à l'argent, au marché boursier ou à d'autres opportunités financières. |
Investissements, Crédits, Prêts Immobiliers, ... |
PRODUITS DIVERS |
Offres publicitaires pour des produits ou services |
Produits et services divers hors des autres catégories |
MULTIMEDIA |
Offres publicitaires pour des produits et services multimédia, des logiciels |
Logiciels de création de sites, antivirus, antispam, ... |
SPIRITUEL |
Informations se rapportant à l'évangélisation religieux ou spirituel |
Astrologie, Groupes de pensée, Religion, Psychologie, ... |
ESCROQUERIE |
Messages frauduleux avec intention de nuire, d'escroquer ou de désinformer |
Chaine de lettres, Pyramide d'arrangements, Investissements étrangers, ... |
CONCOURS |
Promesses de prix, récompenses, voyages, gains d'argent facile,... |
Offres de vacances, Casinos en ligne, Jeux, Tirages au sort, ... |
SANTE |
Offres publicitaires pour des produits ou services en rapport avec la santé |
Produits miracles, Médicaments interdits en France, Médecines douces,... |
anti-pourriel e-mail anti-spam anti-pourriel scam anti-scam anti-spams malware Blacklist filtre e-mail antivirus phishing anti-spam comparaison scam logiciel anti-spam anti-spams filtre anti-spam messagerie anti-pourriel courrier electronique mails anti-virus spamming logiciel anti-spam logiciel antispam antivirus malware comparaison Blacklist filtre filtre antispam comparaison
Les cibles du spam
Le spam s'attaque à différents médias électroniques : courriers électroniques, forums de discussion de Usenet, moteurs de recherche, wikis, messageries instantanées, etc.
Par courrier électronique
Le pourriel ou le spam par courrier électronique est le type de spam le plus utilisé et le plus connu. Il est très aisé d’envoyer des courriers électroniques à un grand nombre de destinataires et ceci à un coût d’envoi très faible. Le coût de réception et de stockage en boîte aux lettres est supporté par le destinataire, ce qui engendre des coûts non négligeables aux prestataires de services, en raison du volume occupé par le spam.
En comparaison aux emails de promotion commerciale pour lesquels l’utilisateur à la possibilité de donner son accord pour leur réception, le spam lui ne le demande pas, il n’est à aucun moment sollicité par l’utilisateur. Il est rédigé dans le but de déjouer les filtres anti-spam des utilisateurs. L’orthographe des mots reconnus par ces filtres est donc modifier afin de passer outre, par exemple, pour le mot clé Viagra, que l’on trouve dans de nombreux spams, peut être ainsi écrit « v1@gr@ » ou « v|agra » afin de tromper une règle de filtrage basée sur ce mot.
D’autres techniques sont notamment employées par les spammeurs pour masquer leurs activités et ne pas être démasqués, comme la falsification des adresses d'expéditeur ou l’utilisation de serveurs SMTP non sécurisés pour l’envoi d’emails anonymes.
Ce sont des robots d'indexation qui collectent généralement les adresses qui faire l’objets de spams, par ailleurs, il existe un marché pour les listes d'adresses.
Afin d’éviter les spams, les internautes font souvent apparaître leur adresses de manière masquée, lorsqu'il a besoin de la faire apparaître dans un site Web ou dans Usenet. Voici 2 exemples :
Pierre@NOSPAM.exemple.fr
pourPierre@exemple.fr
.Pierre à exemple point fr
pourPierre@exemple.fr
Par message de forum de discussion
Avant même l’apparition des spams par courrier électronique, cette forme de spam est apparue via Usenet. En effet, les forums de discussion de Usenet sont une cible facile pour les spammers car un message qui est envoyé à un forum touche l’ensemble des lecteurs du forum. D’ailleurs, certains groupes de discussion reçoivent quasiment que du spam et c'est pour cela que de nombreux forums sont surveillés soit par un humain, soit par un robot qui effectue un tri parmi les articles proposés. De plus, les adresses électroniques des usenautes figurent souvent dans leurs articles, et les spammeurs ont, ainsi, facilement la possibilité de récolter des milliers d'adresses grâce par exemple à un robot, et peuvent ensuite spammer les auteurs de ces articles par courrier électronique.
La publication croisée ou la publication multiple consistant à destiner un message à plusieurs groupes simultanément ou à envoyer le message dans plusieurs de groupes de suite rendent le phénomène pénible et difficile à combattre. Par conséquent les messages de promotion de tout type sont interdits dans les forums Usenet, sauf news:alt.business.
Pour Usenet, lorsqu’un lorsqu'un article, quel que soit son contenu, et même s'il n'appartient pas aux catégories usuelles de messages abusifs (publicités commerciales, escroqueries, insultes...) est publié en un nombre d'exemplaires excessif, celui est considéré comme un spam.
Les réactions des usenautes spécialisés dans la lutte contre le spam aboutissent bien souvent à des accusations de censure et de cabale.
Le spamdexing
Certains spams sont destinés aux robots d'indexation des moteurs de recherche afin de modifier des pages Web et d’augmenter ainsi les chances d'avoir un bon classement au sein du moteur de recherche.
Nous pouvons citer les techniques utilisées suivantes :
- Manipulation de mots clés en ajoutant une longue liste de mots souvent recherchés (par exemple « sexe » ou « piratage ») répétitivement dans une page (« sexe à UneVille », « sexe à UneAutreVille », « sexe à EncoreUneAutreVille », « sexe à UnVillageTropPetitPourÊtreUneVille », et toute autre variation possible) pour apparaître immédiatement si l’internaute fait une recherche avec ces mots. Parfois une page ne contient que les résultats d'une recherche, mis sur le Web pour être trouvé et classé par les moteurs de recherche et affiché aux usagers qui effectuent des recherches avec ces mêmes mots.
- Bourrage de mots clés populaires, soit en les imprimant blanc sur fond blanc, ou en utilisant la police de caractères la plus petite, ou encore en les utilisant en lignes « commentaire » et « méta » qui ne sont pas affichées à l'utilisateur, ou en modifiant le contenu de la page après que le logiciel « robot » ou « araignée » l'ait lu ou en changeant le serveur pour envoyer une page au moteur de recherche et une autre aux utilisateurs ordinaires.
- Spam de liens qui consiste à créer des liens vers un site que l’on souhaite promouvoir dans autant d'autres sites externes que possible, forums publics et pages de commentaires d'autres sites étant inclus.
- Une ferme de liens (link farm) se définit comme étant un site qui héberge des listes de liens vers les autres sites qui sont ici contrôlé afin d’améliorer leur classement en les faisant apparaître populaires. Google comptabilise la quantité ainsi que l'importance des liens vers un site dans le but d’évaluer l'importance du site. Dans certains cas, des sites multiples (simulant des sites indépendants et pas simplement des sous domaines du même site) avec presque le même contenu sont construits. Et, chacun contient un certain nombre de liens vers tous les autres afin d’accroître leur classement de façon significative.
- La technique du Googlebombing consiste à placer au départ des hyperliens vers George W. Bush avec des phrases comme « l'idiot du monde » dans le plus grand nombre de site Web possible. Le destinataire de cet hyperlien est en général un site externe. Si ce type de lien est présent dans un nombre suffisant de pages Web, une recherche pour « l'idiot du monde » va immédiatement orienter l’utilisateur sur Bush, peu importe s'il le souhaite et peu importe si ces mots sont mentionnés sur son site.
- Le Spam des affiliés (affiliate spam), ici, soit c’est une compagnie qui paye pour chaque visiteur, soit chaque client est envoyé par des liens affichés par d’autres, du genre «affiliez-vous et devenez riche, mettez un lien vers www.arnaqeur.porno.example.com et pour chaque victime qui nous donne tous ses numéros de carte de crédit nous vous donnons un sou ». Ce type de liens provenant de ces programmes d'affiliation contient le code d'identification d'un affilié de façon www.arnaquer.porno.example.com/donnemoiargent?MonsieurLeSpammeur pour laisser savoir qui doit être payé pour avoir posté tous ces liens partout.
Les opérateurs de sites de recherche se battent pour détecter efficacement et définitivement ces types d’abus et pour rendre leur utilisation difficile.
antivirus spammeur anti-virus comparaison spam mail mails antivirus filtre antispam spams anti-scam antispam mails scams logiciel antispam malware spams comparatif scams malware email virus anti-pourriel ASP pourriel pourriel virus mail Blacklist logiciel antispam anti-spam antispam anti-malware filtre antispam