Revoliucinis kovos su nepageidaujama reklama būdas

Publikuota: 2002 m. rugsėjo 24 d. antradienis
Spam
Nepageidaujami reklaminiai el. laiškai („spam“) jūsų pašto dėžutėje – viena rimčiausių problemų pasauliniame kompiuterių tinkle. Jiems skaityti ir trinti leidžiama didelė dalis darbo dienos laiko, o šiandien egzistuojantys filtrai, deja, toli gražu nėra tobuli. Neretai pasitaiko atvejų, kai įkyri reklama prasibrauna pro filtrų apsaugą, o įprasti normalūs laiškai, atvirkščiai, paliekami nepageidaujamų laiškų segtuve. Mažai šiukšlių siuntinėtojus įbaugina teismai ir baudžiamosios bylos, leidžiami vis griežtesni įstatymai, pateikiami milijoniniai ieškiniai. Nepaisant filtrų „nesėkmių“, jie nuolatos yra tobulinami. Pavyzdžiui, amerikiečių programuotojas dėstytojas Polas Gremas paskelbė internete straipsnį, kuriame pasakoja apie gana efektyvų kovos su įkyria reklama metodą. Minėtasis metodas paremtas tikimybių teorija ir nepageidaujamiems reklamos laiškams filtruoti naudoja Bejeso algoritmą.
Nepageidaujami reklaminiai laiškai
Šiais laikais didelė dalis filtrų iš laiškų srauto išskiria nepageidaujamas šiukšles remdamiesi tam tikrais simbolių rinkiniais. Tai gali būti žodžiai arba jų junginiai, ištisi sakiniai arba HTML žymės. Tokie metodai gali būti gana efektyvūs. Štai P. Gremo sukurtas paprastas filtras aptiko 79,7 proc. reklamos; tik 1,2 proc. normalių laiškų priskirti nepageidaujamųjų grupei. Šios sistemos tobulinimas tapo gana sudėtingu uždaviniu. Gremas jam išspręsti pašventė daugiau nei pusantrų darbo metų, kol pagaliau jam į galvą šovė mintis reklamai filtruoti panaudoti statistinius algoritmus. Gremo sukurtame filtro prototipe kiekvienam el. laiškuose sutinkamam žodžiui arba žymėms pritaikoma tikimybių teorija. Šių tikimybių pagrindu, naudojantis Bejeso algoritmu, išskiriama tikimybė, ar gali konkretus laiškas būti reklaminė medžiaga.
Nepageidaujami reklaminiai laiškai
Didelė tikimybė, kad reklama bus palaikyta ne tik pamėgti šiukšlintojų žodžiai, kaip antai, „sexy“ arba „promotion“, bet ir netikėtas, iš pirmo žvilgsnio, junginys ff0000 – ryškiai raudonos spalvos HTML kodas. Atitinkamai yra menka tikimybė, kad tarptautiniai terminai arba profesionalų žodžiai, retai vartojami reklamose, bus palaikyti nepageidaujamų laiškų turiniu (pvz., „standartization“ arba „mandatory“). Išbandydamas nepageidaujamų laiškų filtravimo sistemą, Gremas joje patikrino 8000 laiškų, kurių pusė buvo šiukšlės. Pro filtrus prasprūdo tik 0,5 proc. reklaminių pranešimų. Gremo nuomone, kad sistema iš tiesų veiktų nepriekaištingai, ji privalo būti reguliuojama individualiai, kadangi terminologija, vartojama susirašinėjant el. laiškais įvairių žmonių, skiriasi. Jeigu vartotojas reguliariai žymės reklaminius laiškus kaip nepageidaujamą reklamą, tada reklama sukaups pakankamai informacijos, kad galėtų efektyviai filtruoti el. paštą. Gremas sukūrė savo filtro variantą jo paties sukurta „Arc“ kalba (LISP variantas). Entuziastų grupė šiuo metu dirba su spambayes projektu. Jo tikslas – nepageidaujamų el. laiškų filtro kūrimas Bejeso algoritmo ir „Python“ kalbos pagrindu.
Šaltinis:
Kopijuoti, platinti, skelbti bet kokią portalo News.lt informaciją be raštiško redakcijos sutikimo draudžiama.

facebook komentarai

Naujas komentaras


Captcha

susiję straipsniai

Lietuvoje informacinių ir ryšio technologijų plėtra išlieka stabili (170)

Tarptautinės telekomunikacijų sąjungos duomenimis, Lietuva užima 41 vietą pagal informacinių ir ryšio technologijų plėtrą šalyje. skaityti »

Lapkričio 21 d.– Pasaulinė televizijos diena

Pirmoji televizija atsirado dar 1884 m., o kaip ji pasikeitė iki šiol? skaityti »

Vilnius pateko į klestinčių išmaniųjų miestų 100-uką

Švedų IT bendrovė „Easypark“ ištyrė 500 pasaulio miestų, iš kurių atrinko 100, atitinkančių aukštą technologinį lygį pagal žmogaus potencialo plėtros indeksą. skaityti »

Po sunkių traumų ligoniams atsigauti padeda ir virtuali realybė (27)

Virtualiosios realybės technologija nebėra inovacija, skirta vien tik pramogauti, ją įvertino ir medikai. skaityti »

Kas sukūrė pirmąją kompiuterio programą?

Pirmoji programuotoja gyveno laikais, kai kompiuteriai dar net neegzistavo skaityti »

JAV kuriamas dronas, kuris įvykdęs užduotį tiesiog išnyksta

JAV kuriamas dronas, kuris po užduoties įvykdymo tiesiog išnyksta - mokslinei fantastikai prilyginami reikalavimai buvo išpildyti skaityti »

5 neįtikėtinos inovacijos, greitai tapsiančios mums prieinama realybe

Naujausi technologijų gamintojų išradimai kuriami siekiant ne tik palengvinti žmonių kasdienybę, bet ir praturtinti jų gyvenimus. skaityti »

Holografinis kompiuteris „Microsoft HoloLens“ atkeliavo į Lietuvos rinką

Holografinis kompiuteris „Microsoft HoloLens“ nuo šiol tapo prieinamas dar 29 naujose šalyse. Inovatyviu technologiniu įrenginiu nuo šiol galės džiaugtis ir lietuviai. skaityti »

Ar žinote, kam dar naudojamas šviesolaidinis kabelis?

Šiais laikais išgirdęs žodį „šviesolaidis“ arba „optinis kabelis“ iš karto pagalvoji apie internetą. Tačiau, pasirodo, šviesolaidinis kabelis naudojamas ne tik interneto ryšiui užtikrinti. skaityti »

Lietuviai kurs sistemą, užkertančią neteisėtus ir kenkėjiškus bepiločių orlaivių veiksmus

Nepaisant spartaus plėtros tempo, dronai vis dar laikoma nauja technologija, todėl Europos Sąjungos mastu bepiločių orlaivių naudojimas iki šiol nėra vieningai reglamentuotas. skaityti »