Spam

====


"Máte novou poštu." Dva Nigerijci a dcera generála ze Sierry Leone potřebují naši asistenci, nabídka revoluční diety, levná Viagra, něco v azbuce, nepřeberné množství pornografie rozmanitého druhu a nekvality, pyramidové investiční schéma co OPRAVDU FUNGUJE!, rozsypaný čaj co asi bude čínština, a to celé korunováno nejvýhodnější hypotékou. Den jako obvykle.


(Co to je, původ názvu, historie)


Nevyžádané reklamní tiskoviny jsou fenomén známý a otravný; zaplňují poštovní schránky, mezi svými listy zákeřně skrývají zapadlá oznámení o důležitějších zásilkách, a pro zhoršení situace jsou tištěné na tak tvrdém papíře, že se nedají použít ani pro účel, ke kterému by se jinak nabízely. Seznamy adres se rutinně kupují a prodávají, často spolu s profily adresátů za účelem přesnějšího cílení reklamy. Fenomén telemarketingu sem naštěstí ještě v plném rozsahu nepronikl, ve Spojených Státech je však telefon zvonící v době večeře a nabízející nějakou z nesmírně výhodných nabídek záležitostí až příliš běžnou. Ani nezmiňuji pasivní metody, kde jako jeden příklad za všechny lze uvést tisíce jasně barevných billboardů dekorujících jinak krásnou krajinu. Byl by tedy malý zázrak, kdyby slizským prackám metačů cílené reklamy elektronická komunikace unikla.


Úplně první nevyžádaná masová reklama v historii počítačové komunikace byl e-mail, datovaný 2. května 1978. Tehdy se Internet ještě jmenoval Arpanet a byl určen výhradně pro vládní a univerzitní použití. Digital Equipment Corporation, tehdy slavný výrobce minipočítačů a později sežraný firmou Compaq, uváděl na trh nové modely třídy Decsystem-20. Gary Thuerk, obchodní zástupce DEC, v záchvatu nadšení nechal rozeslat oznámení o předváděčce VŠEM několika stovkám uživatelů ARPANETu z celého Západního pobřeží. Vlna protestujících odpovědí a stížností na komerční využívání tehdy ještě zcela nekomerční sítě (zlaté časy) překonala jeho očekávání. Negativní publicita incidentu pak na mnoho let zchladila nadšení jeho potenciálních nástupců. Nešlo však o nic nepředvídaného; problematika nevyžádané pošty byla popsána již v listopadu 1975 v dokumentu RFC 706.


V dávných dobách Internetu, kdy tento v povědomí lidí znamenal ještě pořád víc než jen e-mail a web, byl běžným komunikačním prostředkem USENET - celosvětová síť diskusních skupin. Kdokoliv může poslat zprávu do příslušné konference, odkud si jí pak může později vybrat kdokoliv jiný kdo o ní má zájem. Tento systém stále existuje, i když jeho význam je dnes zastíněn barevnějšími a klikavějšími metodami komunikace. Tehdy se však jednalo o hlavní prostředek komunikace mezi většími skupinami lidí, tedy cíl velmi lákavý.


První masová komerční komunikace v historii USENETu byla poslána do blíže neurčeného množství konferencí. 23. května 1988 se Bob Noha pokusil vyžebrat peníze na pokračování ve studiu na univerzitě. Trvalo ale 8 let než byl tento post nazván spamem. Mezitím ekosystému reklamní pošty dominovaly nabídky pyramidových systémů na rychlé vydělávánní peněz (MMF, "Make Money Fast"), těch však tehdy ještě nebylo mnoho.


Roku 1988 Craig Shergold, tehdy devítiletý, čekal v Marylandu na operaci mozkového nádoru. Jeho jménem byla poslána sada dopisů oznamujících úmysl dostat se do Guinnesovy knihy rekordů v množství přijatých pohlednic s přáním uzdravit se; dopisy byly řetězově rozesílány dál, poštou, emailem, i Usenetem. Email mutuje a v různých verzích koluje dodnes (některé vyžadují vizitky za skrytým účelem vytváření seznamů adres), jmenovaný operaci ve zdraví přežil a nedávno dostudoval univerzitu. Jeho rodina se pod náporem pošty odstěhovala, Craigova stará adresa má své vlastní směrovací číslo, zatím na ní přišlo skoro 400 miliónů pohledů a dopisů, a jejich přítok neustává.


Pojem "spam" se tou dobou již vyskytoval v komunitě uživatelů MUD a MUSH serverů, virtuálních světů podobných starým textovým adventurám. Označoval situaci kdy bylo na obrazovce takové množství příchozí komunikace, že bylo obtížné se v něm dostatečně operativně vyznat, kdy data přicházely tak rychle že se nedaly číst. Výraz má původ v jedné ze scének skupiny Monty Python, kde v restauraci banda Vikingů zpívá píseň o lančmítu, zatímco servírka recituje dlouhý jídelní lístek kde skoro nic jiného není. SPAM (SPiced hAM, kořeněná šunka) totiž původně bylo něco jako lančmít vyráběný firmou Hormel - dle očitých svědků nic moc. 


Roje otravných zpráv však nemusí být jen komerční povahy. V noci 31. března 1993 uvedl Richard Depew do provozu automatický administrační systém pro USENETové konference, ARMM, za účelem automatické modifikace anonymních zpráv. Tento se zacyklil a než byl zastaven poslal do konference news.admin.policy přes 200 zpráv, zvětšujíc délku jejich hlaviček během každého cyklu. Než se jej po telefonátu jednoho z administrátorů podařilo zastavit, některé ze zpráv již byly natolik mimo specifikace, že způsobovaly havárie čtecích programů a i některých serverů. Joel K. "Jay" Furr ve své reakci na tento incident poprvé v historii použil výraz "spam" v kontextu USENETu a emailu. 


První superspam zasáhl Usenet 18. ledna 1994, kdy Clarence Thomas, sysadmin Andrews University, rozeslal do asi 5000 diskusních skupin zprávu o blížícím se příchodu Ježíše. Následovala obligátní vlna stížností. Clarence byl mírně potrestán, a později univerzitu opustil a později se stal autorem několika menších náboženských spamů.


I přišel 13. duben 1994, zlomový den v historii internetové reklamní komunikace. V asi sedmi tisíci diskusních skupinách se objevila zpráva od arizonské právnické kanceláře Canter&Siegel, nechvalně známé a nyní již po zásluze bývalé firmy v oboru amerického imigračního práva, nabízející předražené poradenské služby pro účastníky imigrační loterie zelených karet. Následovala prudká vlna protestů - providerovi této dvojice zkolabovaly poštovní servery pod náporem desetitisíců stížností a raději se nepohodlných právníků zbavil. Tito po několika dalších, ještě méně úspěšných pokusech nevyžádaných reklam zanechali. Internet však již nikdy nebyl to co dřív.


Z Usenetu se problém postupně přestěhoval do mailboů jednotlivých uživatelů. Reklamometčíci začali odebírat konference a z jejich obsahu extrahovat seznamy adres, jejichž majitele pak oblažovali svými nabídkami. Účastníci konferencí se rychle naučili buď používat ve svých příspěvcích email falešný, nebo jej alespoň modifikovat tak, aby byl rozpoznatelný člověkem, ale ne strojem. "Sklízení adres" se ale ujalo a začalo být používáno i v kontextu webu. I samotné seznamy adres se staly cenným zbožím.


(Velikost problému)


Reklamní email se stal základem celého průmyslového odvětví, jeho množství den ode dne roste. Ze vzorku tisíce uživatelů zkoumaného společností Symantec dostává 370 lidí přes 100 spamů týdně, dalších 260 pak 50-100. 650 lidí ze vzorku uvedlo, že zpracováním spamu stráví denně přes 10 minut, 240 z nich pak přes 20 minut (tedy přes 60 a přes 121 hodin na osobu a rok). Dle zprávy Worldtalk Corporation z března 1999 představoval spam 10% celkového počtu emailů; odhad pro rok 2003 je již celých 40-50%, a vzestupná tendence má pokračovat. Dle jiných statistik trvá zpracování jednoho spamu asi 4.5 sekundy. Při nákladech na zaměstnance řekněme 200 korun na hodinu jde o čas v ceně 25 haléřů. Při počtu 100 zaměstnanců kde každý dostane denně pouhých 20 spamů jde o 500 korun denně. Není počítáno zbytečné zatížení přenosových linek a kapacita disků mailserveru.


(Typy spamů - komerční spamy, porn, MLM, Nigerijský spam, řetězové dopisy, hoax viry)


Vlastní spam je povahy rozmanité. Naprostá většina je povahy komerční - povětšinou prodej čehosi co nepotřebujete, přístup k něčemu co se dá stejně sehnat zadarmo pokud víte kde, půjčky, hypotéky, diety, léčiva, software, různé podvody. Zbytek je povahy ideologické a náboženské, nebo testovací zda je adresa příjemce platná. Někteří autoři pod pojem spam zahrnují i ostatní formy nevyžádané komunikace - např. emailové červy, hoax viry, či řetězové dopisy.


Nejznámějším propagovaným artiklem je pornografie. Dle průzkumu ze spamfilterreview.com je považována za bezkonkurenčněnejotravnější, i když s celkovým objemem 19% je až na třetím místě. První místo s 25% obsazují nabídky různých produktů - od bezdrátových videokamer přes náplně do tiskáren po miniaturní autíčka na vysílačku a snad úplně všechno ostatní; následují finanční nabídky s 20% - půjčky, hypotéky, "výhodné" akcie. Čtvrté místo s 9% zabírají nejrůznější typy podvodů, následují nabídky léčiv (Viagra, dietní pilulky, stimulancia) a softwaru a internetových služeb (někdy i spamující software a seznamy adres) - 7% každý, různé dovolené a cestování (6%), duchovní a náboženské rady a "varování" (4%), a 3% zbytku kam může patřit úplně cokoliv. Statistické poměry se však obvykle liší individuálně; záleží na kterých seznamech se vaše adresa ocitla. Dle stejného zdroje 28% uživatelů někdy odpovědělo na spam a 8% dokonce zakoupilo některou z nabízených služeb.


Samostatný odstavec si zaslouží podvody. Nejstarší jsou pyramidové hry typu letadlo, také zvané "Ponzi schémata", kde každý účastník např. pošle čtyřem předchozím úrovním po pětidolarové bankovce, a pak shání další účastníky kteří budou zase posílat jemu. V případě nekonečného množství hráčů by to i fungovalo, v reálném světě však po několika úrovních dojde populace planety. Druhou velmi oblíbenou variantou jsou podvody nigerijského typu. Dcera svrženého generála má někde ulitých pár miliónů dolarů, ale je švorc, takže žádá o příspěvek na umožnění převodu peněz. Pokud ji nebudete ignorovat a peníze pošlete, objeví se "nečekané problémy" vyžadující další investice, a budete postupně ždímáni, dokud neztratíte trpělivost nebo všechny peníze. 


Poměrně novým a zákeřným typem emailového podvodu je "phishing": padělané maily vypadající jako od legitimních organizací (typicky Yahoo, eBay, nebo PayPal), žádající příjemce o poskytnutí jejich osobních dat, hesel, nebo čísel kreditkaret - buď přímo v emailu samotném, nebo - častěji - oběť odkáží na website ("Klikněte zde") vypadající úplně stejně jako originální login stránka příslušné organizace, ale odevzdávající vyplněná hesla protivníkovi. Oběť je pak přesměrována zpět na pravý website a často ani nic nepozná. Útok tohoto typu se nevyhýbá ani klientům finančních institucí - 18. srpna 2003 varovala Citibank své klienty před emailem mámícím jejím jménem z klientů jejich osobní informace použitelné pro krádež identity. V červenci 2003 např. získal sedmnáctiletý útočník tvářící se jako America On-Line (AOL) z kreditkaret jejich klientů přes 3500 dolarů. Mezi organizace "vypůjčené" pro phishing patří zatím i Bank of America, First Union Bank, Best Buy, Earthlink, a UPS.


(Přenosová média pro spam - email, USENET, IM, SMS)


Nejen emailem však živ je spammer. Relativní popularita USENETu klesla, neklesl však objem nevyžádaných zpráv v konferencích; situace je částečně ulehčena poměrně dobře fungujícími mechanismy na odstraňování spamu, bez nich by však pravděpodobně došlo k téměř úplnému zániku konferencí následkem jejich praktické nepoužitelnosti. Zájmu neunikají ani ostatní média; instant messaging je jednou z postižených služeb, ICQ se mladými dívkami s webkamerami a ochotou udělat cokoliv doslova hemží. Relativní novinkou je Windows Messenger spam - šedé okno s textem a tlačítkem OK, vyskytující se na k Internetu připojených nezafirewallovaných strojích a obvykle nabízející předražený program k zalepení této díry. Zvláště nechutně otravné reklamě v podobě pípajících SMS zpráv v našich podmínkách zatím dominují pouze sami mobilní operátoři a jejich služby, je však jen otázkou času, kdy hnáni kapitalistickou hrabivostí začnou poskytovat hromadné zasílání SMS i třetím stranám. Ani pevné linky pozornosti neunikají - telemarketing jen v USA představuje prosperující průmyslové odvětví s ročním obratem 612 miliard dolarů, vyskytují se i reklamní faxy.


(Původ seznamů adres - web spiders, newsgroup bots, website subscriptions, SMS soutěže)


Zpět k emailům. Pro úspěšnou kampaň je nutný seznam dostatečného množství vhodných adres - cílů. Existuje mnoho metod jejich získávání. Nejznámější je použití "pavouka", programu prohledávajícího web podobně jako např. Google nebo Seznam, který místo indexace stránek z nich extrahuje emailové adresy. Oblíbený je odběr USENETu, a extrakce adres z příspěvků nebo alespoň jejich hlaviček. Běžné jsou kompilace adres z rozmanitých registračních formulářů co jimi Internet oplývá; tyto bývají velmi ceněné, neboť často obsahují demografické informace, pravdivě a naivněvyplněné uživateli služeb. Víceméně jakákoliv stránka s formulářem pro zadání emailové adresy představuje riziko. Existují i aktivnější pokusy o kompilace seznamů; obvykle skryté pod rouškou např. spotřebitelských soutěží. Tyto mohou poskytnout i chutnější seznamy než suché emaily: mobilní telefonní čísla - pošlete nám SMS s odpovědí na hloupou otázku, my vám jich pak pošleme stovku s reklamami. Při registraci do soutěží se typicky opět vyplňují dotazníky s demografickými informacemi, často i s fyzickou adresou. Kombinace adresa-telefon-email spolu s ostatními údaji jako věk, zájmové skupiny, a rodinný příjem se dá použít pro poměrně velmi přesné cílení reklamy.


Doporučuje se velmi pečlivě přečíst drobný tisk před tím než člověk formulář odklikne, a i tak je lepší pravdivé informace neuvádět. Když průmysl lže nám, je jenom fér lhát průmyslu.


Dokonce ani seznam pořízený jinak solidní firmou nemusí být v bezpečí. Může být odcizen, potají prodán v celku či po částech. Může být prodán "pod stolem" firmou v nouzi, jak se stalo klientům serveru MusicCity.com nějakou dobu po registraci P2P klienta "Morpheus". Firma vlastnící seznam se může položit a tento pak přejde do rukou věřitelů. Rizika jsou nesčetná. Nemluvě o možnosti selektivního "útoku právníkem" na data jednoho konkrétního uživatele nebo malé skupiny, kdy se použije uměle vyvolaný soudní proces k jejich získání soudním příkazem jako "důkazního materiálu". Běžný uživatel obvykle nemá šanci zjistit že ho někdo prodal.


Do seznamů spammerů je možné se dostat i náhodou. Modernější emailoví červi si kompilují své vlastní seznamy, extrahují emaily z adresářů, mailboxů, a keší webových stránek napadených počítačů; stačí když v jednom jediném z nich bude mail co jste tam poslali. Červíček pak vytvoří seznam, náhodně z něj zvolí odesílatele - obvykle vás, a rozešle jej jeho jménem všem komu může - včetně spamosběrných adres. Kde pak budete automaticky zařazeni na seznam a za pár haléřů za kus prodáni do emailového otroctví.


Viry, červi a trojští koně mohou hrát roli pomocníků spammerů i jinak. Díky notorické děravosti Microsoft Internet Exploreru můžou některé stránky na ne úplně zalepených strojích změnit domovskou a vyhledávací stránku, a při každém jeho otevření oblažit uživatele reklamou a sledovat jeho pohyby po Síti. Lze též přesměrovat vytáčené připojení přes dražší zahraniční tarif; obvyklý trik využívaný v nejspodnější části pornografického byznysu. Často se objevuje i javascriptový červ vkládající se do všech odchozích emailů jako podpis; do nakažených počítačů pak může nainstalovat software dle libosti. Bille Gatesi, povolit scripty v příchozích emailech NEBYL dobrý nápad!


Máte-li mail na některém velkém serveru, např. hotmail.com, můžete se stát obětí hádání adresy. Reklamometčík vezme seznam nejčastěji se vyskytujících jmen a jejich variant, cokoliv co může být použito jako seznam adres, a pak na ně zasílá testovací emaily. Server sám pak oznámí zda daná adresa existuje, zda je na ní schopen mail doručit. Tato podmnožina seznamu pokusů se pak použije pro oblažení uživatelů nabídkou Viagry.


(Validace adres - unsubscribe, web bugs)


Adresy získané sklízením stránek nebo USENETu však nemusí být přesné. Mnohé již dávno neexistují, mnohé neexistovaly nikdy. Mnohé sice technicky existují, ale nejsou aktivně používané. Na mail zaslaný na některou z nich nikdo určitě neodpoví, investovaný čas a bajty jsou tedy vynaložené zbytečně. Surové seznamy adres vytěžené z webu a USENETu se tedy musí pročistit, pak teprve získávají na ceně a dají se lépe prodat jako ověřené.


Nejprimitivnější ověřovací metodou je požádat samotného příjemce o kontaktování odesílatele. Nabídne se mu nějaké lákadlo - soutěž, nebo - nejčastěji - nabídka NEZASÍLÁNÍ dalších spamů ("Unsubscribe here"). Naivní se chytnou a svou adresu pak v databázi potvrdí jako existující a aktivně používanou. (Odhlašovací adresy jsou v některých případech legitimní a funkční, v současném klimatu je ale lepší na to nespoléhat.) I méně naivní uživatelé mohou mít smůlu; stačí když nástražnou pseudoodhlašovací adresu jejich jménem navštíví červ.


Relativně sofistikovanou metodou ověřování adres jsou webové štěnice ("web bugs"). Emaily již nejsou jen holý text, ale mohou být i v HTML, se všemi multimediálními vymoženostmi webových stránek jako obrázky a ActiveX applety a samozřejmě všemi příslušnými bezpečnostními otvory. Bezpečnostní otvory povahy technické jsou obvykle využívány červy, nás však zajímá otvor povahy architekturální - možnost poslat HTML email s obrázkem který je natažený z jiného serveru. Při otevření takového emailu, pokud jsme právě připojeni k Internetu, se poštovní klient připojí k serveru a stahne si z něj obrázek, který pak ukáže. My však můžeme do adresy obrázku zakódovat i např. adresu příjemce, nebo sériové číslo k němuž je adresa přiřazena v databázi. Pak již samotným otevřením emailu příjemce potvrzuje že daná schránka je aktivně používaná. Lze také použít sušenky (cookies), malé kousky informace které klient posílá určenému serveru pokud mu tento server někdy předtím řekl že tak má učinit - může si nás tedy pamatovat i mezi transakcemi. Reklamní banner z jajsemspammer.com zobrazeny na jinakneskodnywebsite.cz a web bug na tu samou adresu z emailové kampaně pak umožní přiřadit k emailu oběti seznam jí navštívených serverů získaných pomocí klasických webových štěnic a/nebo reklamních bannerů. Každý požadavek na objekt (stránku, obrázek, soubor...) spolu totiž nese IP adresu žadatele, typ jeho prohlížeče a operačního systému, adresu stránky z níž je objekt vyžádán, a při opakované návštěvě serveru i eventuelní cookie. Použít cookie jako identifikační číslo pro udržování databáze opakovaných návštěvníků je triviální. Implikace existují i mimo svět reklamy, příkladem budiž aféra zvaná Cookiegate. Roku 2000 uzavřela FBI kontrakt s Altavistou. Uživatelé kteří hledali klíčová slova v souvislosti s drogami dostali spolu s výsledky naservírovaný reklamní banner od Doubleclik.net, mířící na protidrogový website Freewibe.com, navržený za peníze daňových poplatníků drahou PR společností Ogilvy&Mather. Spolu s bannerem dostali i cookie. Doubleclick je velký dodavatel reklamních proužků - bannerů, uživatelé tedy v jeho databázích zanechávají slušný seznam serverů které navštěvují. Z toho už se nějaký ten profil udělat dá, a pak jej může pro své účely odkoupit i zmíněná FBI nebo jí pověřená soukromá firma, a pokud se o "zakázané rostlinky" zajímáte moc, může se začít zajímat o vás.


(Prevence)


Úplně nejlepší metodou jak se vyhnout spamu je nepoužívat email, toto řešení je však většinou poněkud nepraktické. Druhou nejlepší obranou je prevence. Emailová adresa se nemá vystavovat na webu (ale zkuste to třeba s info@firma.cz která tam být musí), nemá se psát do konferencí, nikam kde by ji mohli pavouci najít a rozpoznat. Často se používají triky s modifikací adresy ("munging") způsobem který jednodušší program nerozezná ale člověk ano; výsledkem jsou adresy ve tvaru nekdo-at-server-tecka-cz nebo nekdoNOSPAM@server.cz. Velmi nebezpečné je svěřování adresy různým registracím na webových stránkách; pokud vás nemusí kontaktovat a jenom ji chtějí, doporučuje se lhát a dodat buď něco jako x@y.com co neexistuje ale bude považováno za platné, nebo adresu místního politika s proreklamním postojem. Pokud však z daného webu máte dostat nějakou informaci mailem, lhát s neexistující adresou se nedá. Můžete si ale pořídit ještě jednu adresu a obětovat ji pro spam a kontrolovat ji jen tehdy když prokazatelně víte že tam něco přišlo. Optimálním ale pro mnohé nedostupným způsobem je pořídit si celou vlastní doménu a mailserver, takže budete vlastnit všechny adresy @vaseadresa.cz - pak můžete část před zavinutcem použít pro identifikaci odesílatele. Když jsem začal dostávat spamy na musiccity.com@mojeadresa.domena.com, okamžitě jsem věděl odkud email vane a který sliz mne prodal. Další výhodou je možnost odmítnout přijímat poštu na zkompromitovanou adresu, nebo - ještě lépe - ji použít jako zdroj stoprocentního spamu pro automatické učení bayesiánského filtru.


(Obrana - blacklisty, filtry - keyword, Bayesianske)


Další úrovně obrany jsou emailový server a klient. Serverová obrana zahrnuje černé listiny ("blacklists"), seznamy zločinných serverů ostřelujících okolí reklamou. Obvykle jsou udržované v reálném čase na základě stížností. Mezi nejznámější patří Spamcop, Spews, a Osirusoft. Při přijetí každého mailu se server zeptá serveru "černé díry reálného času" (RTBL, RealTime Black Hole) zda je odesílatel čistý; pokud není, email od něj je odmítnut. Někdy jsou takto zablokovány celí provideři, zejména poskytovatelé připojení DSL a kabelových modemů, kde si kterýkoliv uživatel může provozovat svůj vlastní mailserver; za spamování se sice ukončuje kontrakt, ale jsou-li incidenty dost časté, ostatním to nestojí za tu námahu. Například RoadRunner odmítá přijímat poštu z rozsahu adres místního Tele2 a jeden z našich klientů odmítal poštu poslanou přes volny.cz.


Tento postup lze použít i na straně klienta, po stažení pošty ze serveru. Maily ze závadných serverů se označují jako spam a přesouvají do příslušné složky. Běžně jde však pouze o součást komplexnějšího hodnocení. Spam poznáme od pohledu, většina běžné komunikace věci jako "nejvýhodnější hypotéka" nebo "viagra bez předpisu" neobsahuje. Zkontrolujeme tedy mail proti seznamu klíčových slov, přiřadíme skóre ke každé shodě, a pokud je součet větší než limit, mail putuje do složky s odpadem; nejznámější program této třídy je SpamAssassin.


Další generace jsou bayesiánské filtry, programy učící se charakteristiky textu emailu a automaticky se přizpůsobující vývoji spamů. Prázdný filtr se nakrmí dvěma velkými skupinami mailů, kde jedna jsou známý spam a druhá představuje známé legitimní maily. Charakteristiky obou - slova, fráze, přítomnost číslic ve slovech, struktura HTML, odkazy na stránky - se vytvoří automaticky a během provozu se dolaďují. Příkladem za všechny budiž Bogofilter.


(Problémy - filtry na úrovni ISP, collateral damage - blacklistnutí nevinní, falešná pozitiva)


Zcela nepřekvapivě přináší filtrování problémy. Množství incidentů neumožňuje důkladně zkoumat všechny, a mnozí ze správců černých děr trvají na své verzi pravdy. Spammeři lhající o své nevinně situaci nepomáhají. Pravidelně se pak na černé listiny dostávají servery nevinné - mailinglisty, či malí provideři včetně jejich zákazníků. Celý provider může být na listině i za trest, např. odmítne-li vykopnout klienta jehož web byl propagován spamem. V této válce nejsou pevná pravidla. Pokud váš provider spoléhá na něčí blacklist, můžete se docela dobře nedočkat důležité pošty a nikdy se o tom nedozvědět. Takové incidenty se stávají denně a škody způsobené důležitými maily zahozenými jako spam jdou do miliónů. Ať již filtrujete nebo nefiltrujete, nevyhrajete.


(Ostatní neúčinné přístupy - challenge-response + Turing test, pay-for-mail)


Na problém se zkoušejí aplikovat mnohá inovativní řešení. Mezi nejpopulárnější patří schéma challenge-response, kde mezi vámi a příjemcem stojí program. Pokud vás program ještě nezná, pošle vám výzvu; tato typicky obsahuje obrázek s nějak zdeformovaným textem nebo číslem, který máte za úkol přepsat. Tento tzv. reverzní Turingův test vás odliší od stroje; počítače zatím nejsou schopny s rozumnou spolehlivostí takové obrázky rozpoznat. V běžné praxi se ale jedná o systém velmi otravný (zejména máte-li textový terminál bez grafiky nebo jste-li slepec se screenreaderem), a často problematický ve spojitosti s mailinglisty a automatickými a anonymními službami. Komerčním průkopníkem je firma SpamArrest.


Další možnou metodou je zdražení emailu. Příjemce by odmítal maily neobsahující mikroplatbu, a platby za legitimní mail by byly refundované. Lákavě vypadající schéma opět naráží na realitu. Problémy budou stejné jako u challenge-response, plus potíže s infrastrukturou mikroplateb, plus zánik anonymních a pseudonymních služeb, plus nižší spolehlivost vlastní všem komplikovaným systémům. Variantou na toto schéma je platba výpočtem; server odesílatel je donucen spočítat časově náročný příklad a pak je od něj teprve povoleno přijmout mail; tím je omezen objem mailů poslaných za čas, a efektivita spammera se sníží pod hranici rentability. Toto schéma ale naráží na DRAMATICKY odlišné výpočetní kapacity zařízení připojených k Internetu (takže buď půjde švindlovat nebo se bude diskriminovat proti např. kapesním počítačům). Jsou i další ještě méně obvyklé metody, žádná z nich ale není bezproblémová.


(Legislativa - neúčinnost, možnost použití zákonů jako zbraně v konkurenčním boji)


Když se objeví problémy, nabízí se nejjednodušší špatné řešení: další zákon. Zakáže se posílat to či ono. Uvalí se sankce na něco dalšího. Udělí se výjimky pro všechno co si lobbisti poručili a firmy svými příspěvky na strany a na kampaně koupily. Spammeři se odstěhují za hranice, kontraktují zahraniční firmu, nebo použijí proxyservery v zahraničí. Při ceně právníků a efektivitě místních soudů se jedná o postup pomalý a neúčinný. Při dostatečně přísné legislativě se pak spam také dá použít jako metoda konkurenčního boje: protivník rozešle reklamu na vaši firmu, s použitím např. proxyserverů nebo zahraničního kontraktora, a dokazujte pak že jste to nebyli vy. (Tentýž problém existuje již teď, naštěstí ale díky červům rutinně padělajícím odchozí adresy je nyní o něco snažší přesvědčit lidi že adresa v emailu nemusí být pravá.) Zvrzaná a prolobovaná legislativa také nese riziko úplné legalizace některých druhů spamu.


Proti spammerům se již zakročuje v rámci spolupráce mezi providery. Zákaznící kteří poruší termíny smlouvy a začnou metat reklamu se brzy octnou bez připojení; totéž často čeká i majitele spamem propagovaných ("spamvertised") webů. Často se tedy používají připojení na jedno použití (ty nejlevnější nebo s mnoha zkušebními hodinami zdarma jsou nejpopulárnější), a webmaily zadarmo jako kontaktní adresa (opět pro těch několik desítek minut až hodin než jsou odstřeleny). Jejich registrace je často automatický proces. Některé servery, např. Yahoo, tedy zavádějí reverzní Turingův test k zabránění automatickým registracím.


Někteří provideři jsou vůči benevolentnější; zákazníci jsou sice problémoví, ale platí. Jejich život ale není jednoduchý. Ostatní provideři s nimi odmítají uzavírat propojovací dohody, čímž je izolují od Internetu. Jedním z posledních příkladů je holandská společnost Megaprovider, jež poskytovala hosting největším spammerům, včetně gangu Super-Zonda. Megaprovider ztratil značnou část konektivity již v červnu 2002, poté co jeho páteřní poskytovatel TrueServer dostával na jeho spamy přes 30,000 stížností denně.


Spam je ale možno použít i jako mstu nebo útok; pak se pošle jménem oběti. Nejznámější je případ joes.com; 3. ledna 1997 poslal exzákazník vykopnutý z tohoto serveru jeho jménem několik miliónů reklam na zmíněný server. Následovala nepříjemná sekvence kdy samozvaní mstitelé bombardovali oběť všemi druhy denial-of-service útoků a zasílali nepříjemné maily jeho majiteli i providerovi. Majitel svoji pověst nakonec očistil a útoky tohoto druhu získaly název "Joe Job". Dnes v době téměř automatických seznamů serverů od kterých se email nemá přijímat (a slepé závislosti některých providerů na jejich pravdivosti) a díky pokrokům v oboru falšování hlaviček mailů mívají tyto útoky následky ještě horší.


(Triky spammerů - proxyservery, open relays, BGP hijacks, obcházení filtrů (misspelling, word-breaking, send-as-picture), Bayesian poisoning)


Spameři se ale přizpůsobují.


Nejjednoduššímu filtru, mazání bez otevření, se již některé spamy vyhýbají; jejich předměty zpráv jsou obecné a nic neříkající, nebo přímo zavádějící. Mezi dnešním vzorkem byly perly jako "Ahoj", "Fwd: přerušený odkaz", "Oznámení o odpojení", "Poslední otázka", a perla všech perel "Fwd: Sklad techniky".


Kdysi používaná antispamová metoda byla založena na centrálním ukládání kontrolních součtů spamů a porovnávání přijatých zpráv s nimi. Náhodné shluky znaků na koncích předmětů a na koncích (a někdy i v obsahu) spamů samotných jsou úspěšné pokusy jak tento systém obejít. Naštěstí se někdy dají použít jako indikátor pro sofistikovanější filtr.


Filtry klíčových slov nejsou všemocné; spammeři klíčová slova s nejvyšším skóre komolí foneticky i vizuálně. Slova "V1AGRA" nebo "SEXX" bude nepřipravený filtr ignorovat. Slova se také mohou rozbít na části, HTML k tomu nabízí mnoho prostředků. Oblíbené je prokládání slov nesmyslnými HTML tagy nebo komentáři které jsou ignorovány při zobrazení, ale filtr bude mít s rozpoznáním sekvence via<nahodnynesmysl>gra jistý problém. Druhý postup je použití tabulky; stránka se rozdělí na sloupce, do kterých se poskládá text tak aby byl zobrazen čitelně ale aby jeho vnitřní struktura byla pro rozpoznání slov nepoužitelně rozbitá.


Bayesiánský filtr se ale splést tak snadno nedá - triky použité k oblbnutí detektorů slov se samy stávají charakteristickými vlastnostmi. Zde přichází nový trend: otrava filtru. Spam se okoření slovy a někdy i celými odstavci legitimního textu, čímž se jeho naděje na projití filtrem zvýší. Když neprojde, alespoň se pomstí mírným snížením skóre legitimity pro použitá maskovací slova.


Dalším trikem je nepoužít text vůbec a poslat nadílku ve formě připojeného souboru nebo obrázku; text ve formě obrázku se filtrem rozpoznat nedá. Zůstává zde ale pořád naděje ve formě struktury mailu: odkaz na obrázek a obvykle hyperlink na propagovanou stránku; bayesiánské filtry mají šanci se ji naučit.


Blacklist serverů se obchází vyhledáváním a využíváním proxyserverů - jinak velmi užitečných systémů umožňujícím zprostředkovat spojení k jiným počítačům. Příjemce pak místo odesílatele vidí proxyserver, který obvykle ještě nemá v blacklistu, nebo si jej nemůže dovolit zařadit z důvodu rizika falešných pozitiv. V naprosté většině jde o špatně nakonfigurované proxyservery organizací nebo jednotlivců; spammeři scannují Internet na jejich přítomnost dost pravidelně, můj obranný systém hlásí několik pokusů denně. O něco méně obvyklé ale principielně podobné jsou otevřené relay servery - špatně nakonfigurované mailservery povolující komukoliv posílání pošty. (Tyto jsou velmi obvyklé na Dálném Východě, kde je to zřejmě administrátorům povětšinou jedno; někteří zoufalí operátoři pak blokují veškerou poštu procházející přes čínské a korejské servery.) Oba typy zdrojů spamu se sice rychle dostanou na blacklisty, ale ne všichni je používají (zejména kvůli riziku zablokování legitimní pošty), a než se pachatelé dostanou na index je pro několik set tisíc mailů stejně pozdě. Dohledání své identity spammeři ztěžují paděláním hlaviček a využíváním proxyserverů.


Nejsofistikovanější metodou je únos celých rozsahů IP adres. V rámci Internetu se adresy přidělují centrálně, ale jejich správa je distribuovaná; routery se dozvídají co kam mají posílat pomocí protokolu BGP. Spammer pak přijde, nakecá routeru že doposud nepřidělený rozsah byl přidělen a kam je připojen, a informace se rychle roznese po Síti. Pak se provede reklamometná operace a rozsah se opustí. Takto získané adresy se nazývají bogony. Existují ještě zombie, které kdysy byly přiděleny někomu jinému, nepoužity, a později získány nakrmením příslušné registrační organizace zfalšovanými papíry o převodu.


Nejnovější a nejzákeřnější je ale použití červů, specificky rodiny W32/Sobig. Tito malí bezobratlí do infikované oběti nainstalují proxyserver. Podle některých zdrojů je za tímto projektem jihoamerický gang spammerů Super-Zonda.


(Argumenty spammerů - cena-ekologičnost emailu versus papíru)


Existují hlasy na obhajobu reklamních emailů; nikoliv náhodou pocházejí povětšinou od příznivců (čtěte: zadavatelů a provozovatelů) direct-marketingu. Nejčastějším líbivým argumentem je šetření životního prostředí, neboť na email papíru netřeba. Tento argument je ale přinejmenším scestný - smetí v emailové schránce přibývá a v té poštovní neubývá. Dalším argumentem je cena reklamy pro malé podnikatele; v případě spamu ale spojené náklady nese uživatel ve formě místa na disku, času stahování pošty, a rizika vyfiltrování důležité zprávy. Nemluvě o nechutné otravnosti pokud máme na mailu nastavené upozorňování přes SMS. Teoreticky lze také mluvit o přínosu pro příjemce - tento ale obvykle o další dávku reklamy nestojí, ví co chce, má k dispozici vyhledávače, a ví jak si najít sám ještě lepší nabídku.


(Vyplatí se spam vůbec? - článek z Wired, Spam King - protiútok paper-spamem)


Nakupuje ale někdo vůbec u spammerů?


Ano, a ne v malém. Nedávno uživatelé jednoho velkého mezinárodního providera obdrželi celkem asi miliardu spamů ve čtyřech vlnách, propagujících rostlinný přípravek od firmy Amazing Internet Products na prodloužení jisté části mužské anatomie až o 7 centimetrů. Asi šest tisíc adresátů odpovědělo na výzvu objednávkou produktu v ceně 50 dolarů za lahvičku, většina z nich objednala lahvičky hned dvě i více. Dodavatel neměl website zabezpečený, objednávky přirozeně unikly; mezi zákazníky byli manažer šestimiliardového fondu, majitel restaurace, trenér školního lakrosového klubu, chiropraktik, veterinář, několik členů ozbrojených složek, a mnozí další. Nikdo ze zákazníků se zřejmě nenechal zviklat absencí kontaktních údajů firmy ani nepoužitím zabezpečení přenosu dat pro přenos čísla kreditní karty. Přestože pilulky zákazníkům prodlouží asi jenom obličeje, celkový obrat jen z jediné kampaně činil asi půl miliónu dolarů. Lze ještě poznamenat, že obchodním partnerem firmy je bývalý neonacistický vůdce, jež se roku 1999 dal na reklamu poté co se provalilo že jeho otec byl žid.


Svého času velmi úspěšnou a nejnenáviděnější firmou celého Internetu byla Cyber Promotion, již založil Stanford Wallace, známý též jako Spam King, Král spamu. Krátce před svým zánikem kolem roku 1998 byla držitelem seznamu 40 miliónů emailových adres a oblažovala uživatele až 20 milióny reklam denně než postupně ztratila providery ochotné si s ní špinit ruce a prohrála důležitý soudní spor s AOL. Stanford mezitím stihl získat přezdívku "Spamford". Spamfordův předchozí podnik, nevyžádané reklamní faxy, byl ukončen jím vyvolanou legislativou, která jejich zasílání v rámci USA zakázala.


Post krále spamu po Stanfordově rezignaci získal Alan Ralsky. Roku 1997 zakoupil dva počítače a několik seznamů adres a zahájil kariéru, která mu brzy začala vynášet $6000 týdně. V prosinci 2002 již měl seznam 250 miliónů adres a síť 190 počítačů v USA, Kanadě, Číně, Rusku, a dalších zemích - každý schopný poslat 650,000 mailů za hodinu, celkem přes miliardu denně. Většinou přes zahraniční providery. Přes prohru v soudním sporu s Verizonem nyní padesátisedmiletý Ralsky hýří optimismem, a koncem roku 2002 zakoupil za tři čtvrtě miliónu dolarů nový dům v Michiganu. Zákazníky přijde jednorázové obšťastnění celého Ralskyho seznamu na 22,000 dolarů, nebo na podíl ze zisku. Dlouhodobá kampaň na pilulky na hubnutí zaplatila celé křídlo jeho nového domu.


Jiná nabídka od firmy broadcastemailadvertising.com zní na 1250 dolarů za pokrytí 28 miliónů adres. Stačí aby jen zlomek procenta adresátů odpověděl...


V současné době je devadesát procent trhu rozděleno mezi 150 největších subjektů. Ralsky již možná není největší, ale pořád se drží mezi prvními pěti.


(Tvrdší škola protiútoků - counterspam, mailbombing, URL DDoS - zvyšování ceny per spam, uveřejňování identity - případ z NZ)


Mizerným zákonům (viděli už jste dobré?) a honům ze strany providerů se reklamometčíci přizpůsobili rychle. Do polévky se jim ale dá plivnout i drastičtějšími způsoby.


Zahlcování providerů stížnostmi vede k pravidelnému vyobcovávání spammerů a jejich zákazníků a přetěžování jejich infrastruktury v případě že jsou svoji vlastní provideři. Bombardování falešnými objednávkami zahlcuje jejich štáb, objednávky falešnými čísly kreditkaret a na neexistující adresy stojí práci a peníze, denial-of-service útoky vyřazují jejich servery. Je válka nikoliv Růží.


Reklamometčíci jsou nenáviděni. Vědí to, a ti největší se oprávněně bojí o svoji bezpečnost. Většinou se tedy pokoušejí skrýt svou fyzickou identitu. Ne vždy se to ale podaří. Ralsky se donedávna nijak neskrýval, incidenty typu rozličných výhružek či doručení balíčku s psím trusem jej přesvědčily o opaku. Svou novou adresu se pokusil utajit. Neúspěšně; byl dohledán podle registru nemovitostí a publikován. Někdo pak dostal geniální nápad - odplatit stejnou mincí. Stovky dobrovolníků dožraných neutuchajícím přívalem reklam zapsaly Ralskyho adresu na snad úplně všechny objednávky komerčních vzorků a katalogů. Ralsky jich nyní dostává tisíce denně - 2-3 kontejnery papírové pošty - a ani trochu se mu to nelíbí. Chcete-li si přisadit, www.spamhaus.org/rokso/ obsahuje adresy jeho i mnoha ostatních.


Dalším příkladem účinnosti taktiky se proti své vůli stal Shane Atkinson z Nového Zélandu. Měl-li dobrý den, rozmetal se svými kumpány až 100 miliónů reklam. V polovině srpna 2003 mu ale přituhlo; někdo odhalil jeho identitu a vypustil ji na Síť. Nyní dostává urážlivé telefonáty, byl přihlášen do homosexuální seznamky, a jeho email byl zapsán na mnoho přemnoho spamových seznamů. Atkinson se rozhodl reklamometný průmysl opustit.


(Perspektivy do budoucna - a bude hůř)


Rostoucí počet uživatelů Sítě láká reklamometčíky a jejich klienty; jejich aktivita i nadále poroste. Zoufalí uživatelé a ještě zoufalejší provideři se pokusí reagovat divokými blacklisty celých regionů; pak můžete vcelku snadno ztratit nebo nikdy nezískat bohatého korejského klienta pro vaši firmu poté co již nikdy neobdržíte jeho email. Červi rozšiřovaní spammery jako distribuované proxyservery sežerou značnou část přenosového pásma Sítě; zatím jsme viděli jen víceméně amatérská díla, genetické algoritmy, do důsledků dovedený polymorfismus a kooperující komunity - červária nás teprve čekají. Zavedení challenge-response schémat a elektronických známek omezí vzájemnou kompatibilitu mezi uživateli různých systémů. Někteří provideři spolu vzájemně nebudou mluvit a nebudou vzájemně doručovat poštu svých uživatelů. Některé bloky adres budou odmítat s jinými komunikovat úplně. Miliardové investice do blokujících a filtrujících řešení pomohou jen částečně a budou vždy jen dalším tahem v šachové partii. Dojde k balkanizaci dříve jednotné Sítě a fyzickým napadáním mezi majiteli spammujících firem a militantním křidlem antispamových bojovníků. To vše okořeněno neutuchajícími soudními spory, k radosti peněženek zúčastněných právníků. S rostoucím nepřátelstvím ke spammerům poroste popularita joe jobů, viktimizujících nevinné. K nezdaru předem odsouzené pokusy moudrých zákonodárců situaci jen dále zkomplikují. Objeví se vítané i zatracované placené služby zprostředkovávající interoperabilitu uživatelům vzájemně znepřátelených částí Sítě. Mnohé z nich budou řízené bývalými spammery.


Můžeme se jen ozbrojit nejnovější generací filtrů, vyhnout se obloukem providerům filtrujícím bez rozmyslu i těm poskytujícím spammerům přístřeší, nereflektovat na emailové nabídky, a být zběhlí v používání proxyserverů pro obcházení bloků v Síti.


Bude hůř. Mnohem hůř.