Category Archives: IT

Informacinės technologijos ir kompiuteriai, taip pat – ir programavimas

Google ir SEO optimizatoriai

Pilna Lietuva visokių SEO optimizatorių, gyvenančių praeito tūkstantmečio technologijų žiniomis. Jei norit – galit pasisamdyti šarlataną už kelis tūkstančius ar išvis kelis šimtus litų. Tuo tarpu Google tobulėja ir nesustoja. Visos konkuruojančios paieškos sistemos jau seniai tapo praeitimi ir netgi Microsoft bandymai lįst į paieškos metodus atrodo, lyg kūdikiškas veblenimas.

Atsimenu laikus, kai buvo toksai lietuviškas Infoseek – pakakdavo pridėti visokių raktinių žodžių į "keywords" meta tegą ir paieškoje išlįsdavai į pirmą vietą. Vienas mano puslapis buvo pirmas Lietuvoje pagal žodį "sex", nors su seksu nieko bendra neturėjo. Panašiai dusinti buvo galima ir kitas paieškos sistemas. Taip dabar bando daryti dauguma optimizuotojų, tik jau nesėkmingai, neretai nustebdami, kodėl po "optimizavimo" kokį nors puslapį Google išvis nustojo rasti.

Dar visai neseniai Google, įvedus mano vardą ir pavardę, atrasdavo kelioliką tūkstančių rezultatų, dabar randa 2000 su trupučiu. Nors puslapių, kur esu minimas, lyg ir daugėja. Kame reikalas? Ogi paprasčiausiai Google nustatė, kad yra ne šiaip sau du žodžiai, o konkretus žmogus, jais užvadinamas. Google su manim buvo sunkiau, nei su daugeliu kitų: turiu keletą įžymių bendrapavardžių ir kelis kartus keičiau savo veiklą, tad viską užkloja trikdžiai. Visgi, Google sugebėjo.

Jau prieš keletą metų rimti SEO optimizuotojai pastebėjo, kad Google sugeba atskirti gerus tekstus nuo blogų. Puslapis, kuriame tekstus parašė anglakalbis, mokantis rašyti rišliai, suindeksuojamas greičiau ir gauna geresnius rezultatus paieškoje, nei puslapis, kurio straipsniai parašyti laužyta anglų kalba, nemokšiškai ir neįdomiai. Google algoritmai identifikuoja, kiek ir kokių žodžių puslapyje vartojama, kokia sakinių sandara, kokios asociacijos tarp žodžių, kiek dažnai vartojami frazeologizmai, ar graži gramatika, padaro žodžių pasiskirstymo analizę, etc., viską įvertina ir nusprendžia. Primityvūs kompiuterių generuoti atsitiktiniai tekstai, SEO veikėjų naudoti prieš kokius 10 metų, dabar neturi jokių šansų: Google atpažįsta, kad tai beprasmybės.

Kažkada Google algoritmas buvo visiškai paprastas – kažkokiu būdu jie sugebėjo užpatentuoti metodą, bibliotekininkams žinomą jau kelis šimtus metų: tinkamų straipsnių ieškoti ne pagal pačių straipsnių turinį, o pagal straipsnių paminėjimus kituose straipsniuose. Kuo dažniau straipsnis minimas, kuo daugiau nuorodų dedama – tuo aukštesnis reitingas. Iš to ir kilo ilgai trukęs pamišimas rankiotis kituose puslapiuose nuorodas į save. Dabar gi nuorodos tapo greičiau antraeiliu faktoriumi. Google pagal žodžių pasiskirstymus patikimai nustato, ar puslapis prasmingas, kokia jo tema, dar įvertina jo kūrėjo patikimumą (ar serveris, kuriame hostinama nėra spamo platintojas), kokia programinė įranga naudojama, ar seniai tas puslapis veikia, koks jo domenas (".tk" – blogai, o ".edu" – turi net specialių privilegijų) dar krūvelę visokių faktorių, išanalizuoja tekstą, o tada ir paskiria vietą paieškos rezultatuose. Nei vienos nuorodos neturintis puslapis kartais gali pakliūti į pirmą vietą tarp tūkstančių kitų rezultatų.

Google tobulumas – neišpasakytas. Ši sistema atpažįsta visą krūvą skirtingų programų, naudojamų Internete, nustato, ar puslapio savininkas naudoja WordPress, ar kokią kitą programą, o tinkamoms programoms kartais netgi prideda šiokį tokį pliusą. Pavyzdžiui, už tai, kad programa nenaudojama spamerių, o tik normalių žmonių. Google mėgsta įvairius blogus, nes laiko juos tikrų žmonių puslapiais. Google sugeba atskirti, kur bloge yra pats straipsnis, o kur – komentarai, tad vieną ir kitą vertina skirtingai. Google atskiria, kur puslapyje yra meniu, kur reklamos, o kur naudingas turinys. Google netgi patikrina, į kur rodo straipsnyje esančios nuorodos ir už netinkamas pažemina, o už tinkamas – pagerbia. Dar daugiau: jei Google atras, kad į jūsų puslapį rodo daugybė spameriškų nuorodų, galite pasigailėti.

Google senų seniausiai skiria kalbas, kuriomis puslapis parašytas. Lietuviško puslapio ši sistema nekiša amerikiečiams, latviško – nekiša lietuviams. Tačiau dabar ši sistema jau sugeba atrasti, kuris puslapis apie ką – indeksuojami ne tik žodžiai, bet ir prasmės. Google vertėjo algoritmai reikalingesni pačiai Google sistemai, nei žmonėms: anglakalbis, ieškantis informacijos apie lietuviškas karves, kartais gali atrasti lietuvišką puslapį todėl, kad Google žino, jog nors ir lietuviškas, tai geriausiai tinkamas rezultatas.

Galų gale, Google netgi turi tūkstančius samdomų darbuotojų, kurie patys peržiūrinėja įvairius puslapius ir suteikinėja jiems reitingus, kuriais vėliau vadovaujasi paieška: kai puslapį peržiūri žmogus, jis sugeba atskirti, kur yra gudriai užmaskuotas spamas, o kur – labai nevykusiai pateiktas prasmingas turinys. Taip nedaro kitos paieškos sistemos.

Technologijos tobulėja be proto: dabar Google net įstengia atpažinti žmones nuotraukose. Jūsų nuotrauka net be jūsų paminėjimo kartais gali tapti priežastimi, dėl kurios bus atrastas kažkoks puslapis. O pagal įvairius antrinius požymius Google gali atrasti skirtingus puslapius, kuriuose lankotės ir susieti juos paieškos rezultatuose. Jei aktyviai naudojatės internetu, nenustebkite, pamatę, kad pagal jūsų pavardę Google atranda jūsų slapyvardį, kurio nežino net jūsų draugai.

Kažkada Google sistema buvo viena visam pasauliui, bet jau seniai skirtingos šalys ir netgi tų pačių šalių skirtingi regionai gauna pagerintas paieškas. Lankytojas iš Lietuvos gaus kitus rezultatus, nei lankytojas iš Londono, o šis – kitus, nei lankytojas iš Čikagos. Dar daugiau, netgi Kaune ir Vilniuje esantys žmonės neretai suras skirtingus puslapius – ieškodamas baldų parduotuvių, pirmiau rasite tas, kurios jūsų mieste. Bet dabar Google jau to nepakanka: ši sistema neretai nustato, kur koks žmogus ja naudojosi ir kiekvienam paiešką pagerina savaip. Netgi tuo atveju, jei niekaip nesate užsiregistravęs.

Techniniai SEO triukai jau seniai neveikia. Už technines gudrybes papildomų balų negausit – nebent neigiamų, jei Google nustatys, kad esate vienas iš tų SEO optimizatorių. Vienintelė kažkiek veikianti smulkmenėlė – teisingas HTML tegų naudojimas: taip, kad jie atitiktų puslapio semantiką. Žinokite, kam skirtas "h1" tegas ir kuo jis skiriasi nuo "h2". Žinokite, kuo skiriasi "strong" tegas ir kuo jis skiriasi nuo "b". Taip, Google jau seniai tapo semantinės analizės sistema. Google Internetą bando suvokti panašiai, kaip mes, o padedantiems – duoda truputį (bet tik truputį) pliusų. Dirbtinis intelektas? Gal būt – požymių yra.

Wikyblog bliki: wiki ir blogas viename

Prieš kokius porą metų atradau nuostabų daiktą, kurį pilnai įvertinti sugebėjau tik dabar – tai Wikyblog. Programa, kuri yra nuostabus blogo ir wiki hibridas, turintis praktiškai viską, ko gali prireikti, kuriant teminę svetainę. Tai ne tik blogas, tai ne tik wiki, o tiesiog kažkas stebėtino. Naudoju jau seniai, bet iki šiol dar atrandu naujas ir naujas galimybes. Autoriai šitą daiktą pavadino "bliki", tardami, kad tai visai nauja koncepcija. Ir išties – tai  kardinaliai daugiau, nei blogas su wiki viename daikte.

Japoniškas produktas, pilnai (o ne per hakus) palaikantis UTF, dinaminis turinio generavimas, galimybė ir rašyti blogą, ir turėti nuosavą wikipedijos gabaliuką vienu metu, pilnavertis AJAX (kuris, panorėjus, dar ir išjungiamas, o ne privalomas), pilnavertis (o ne mediawiki stiliaus) komentavimas, vaikiškai paprastas templeitinimas – tai tik keli daykai, kurie mane čia sužavėjo. Plius dar visokie pluginai integravimui su forumais, žemėlapiais ir pan.. Ir visa tai – realiai SEO friendly: semantinis kodavimas, pilnas H palaikymas, natyvinis interlinkingas, geri URL, etc..

Jei kam prireiks – turiu jau daugmaž pakankamą lietuvišką vertimą, jį galite atsisiųsti iš čia – http://ptrans.wikyblog.com/pt/Translation_to_Lithuanian/Files
O čia – pats Wikyblog – http://www.wikyblog.com
O čia – dar vienas susižavėjęs pasisakymas apie Wikyblog – http://www.itsm.lt/index.php/Main/Wikyblog

Tai tiek. Rekomenduoju kuo labiausiai 🙂

Apie Microsoft

Kadangi versmes  kažkur pasisakinėjo apie Microsoft ir panašius dalykus, tai prisiminiau vieną tokią istorijėlę, kuri nutiko vienam pažįstamam programuotojui.

Anas programuotojas buvo tikras hakeris, varydavo asmebleriu ant Windows API ir visiems kalbėdavo apie tai, kaip gerai programuoti ant Windows ir koks Linux yra gaidys (taip ir vadindavo – "tas gaidys"). Tiesą sakant, be Windows, jis nelabai ir bandė kur programuoti daugiau, o kai išgirsdavo kokių panašių pasiūlymų, tai labai keikdavosi. Apie UNIX sistemas neturėjo žalio supratimo, visas jas vadindamas žodžiu "Linuksas" arba, dažniau – "gaidys". Bet šiaip, programuotojas jis buvo tikrai geras ir patyręs. Tik kad įsimylėjęs tą windozę mirtinai. Turėjo netgi nuosavą programavimo firmelę su berods vienu ar tai dviem darbuotojais. Gyveno sau. O paskui nutarė išvažiuot į Ameriką, mat iš pat Lietuvos sugebėjo gauti pakvietimą dirbti Redmonde. Taip taip, tame pačiame Microsoft.

Žodžiu, dingo jis iš Lietuvos, ilgai nebuvo jokių žinių apie jį. Daugiau, kaip pusmetį. O paskui – prisijungia per IRC ir ima intensyviai plūstis. Maždaug taip:
Gaidys tas Microsoftas, pyderai ten vieni, būčiau žinojęs, būčiau nevažiavęs… Dirbu Ofiso padaliny. Porą mėnesių buvau testuotoju, dabar programuoju… Gaidys tas Microsoftas. Jie visą ofisą daro ant kažkokio gaidžio. Ant Linuxo, Soliariso kažkokio… Ir visas versijavimas ant kažkokio Linuxo. O paskui, kai parašo, reikia perkeldinėti ant Windows. Nesuprantu, kodėl jie Visual Studio nenaudoja. Gaidys tas Linuxas, kai ant jo padaro, tai net nesikompiliuoja, ištisus gabalus reikia perrašinėt, visi bugai ten dėl to gaidžio

Žodžiu, juokinga istorija. Tai buvo maždaug 2003-2004, ale iki šiol prisimenu 🙂

Linuksas geriau

Linux man ilgai keldavo tam tikrą pasibjaurėjimą. Gal todėl, kad pažįstamas buvau su juo dar nuo priešistorinių laikų. Mokinukiška sistema, savo griozdiškumu ir neapskaičiuotais sprendimais kažkuo panaši į Windows. Nei iš tolo neprilygstanti tokioms sistemoms, kaip FreeBSD, OpenBSD ar Sun Solaris (SunOS). Aš jau nekalbu apie MacOS.

Kita vertus… Vat turiu namie skanerį, nuo seniausių laikų – Mustek USB ScenExpress 1200 UB Plus. Pradžioj, pajungtas prie Windows 2000, jis dar veikė. O paskui, pajungtas prie Windows XP – neveikė, nors tu ką. Paskui nustojo veikti ir su Windows 2000. Net nežinau, kodėl. Gal todėl, kad jau prieš tai ten buvo instaliuotas ir kažkaip užsibugino. Tai ir stovėjo taip nenaudojamas kažkiek metų. Nes neveikė. Nors namie keli kompiuteriai, nei viename Windows jo man nepripažindavo.

Ir taip jau gavosi, kad kartą žmonai suinstaliavau kažkokį Linuksą – net pats neatsimenu, jau kokį (Kubuntu ar tai Ubintu). Na, kad virusų negaudytų. Išties, nustojo gaudyti virusus. Žmona paburbėjo porą dienų ir priprato. Po kiek laiko ėmė aiškinti, kad Windows yra fufelis. Nes Linux nekimba. Ir virusų negaudo. Ir dar ten kažką gerai daro.

Nu, galvoju, ir tegul. Jai gal Linux gerai, o man Windows gerai. Tai ir gerai.

O vat šiandien sugalvojau, kad reikia skanerio – senoms nuotraukoms nuskanuot. Ir ką daryt? Windozė jo nepripažįsta, siunčia mane ant trijų raidžių. Taigi, reik linukse pabandyt. Įsijungiau kažkokią paveiksliukų skanavimo programą tame linukse, o ta iškart ir sako: "Man reikia Sane, kad skanuočiau, o skaneris tavo yra Mustek ScanExpress 1200 UB Plus". Nors XP serijos windozė, atleiskite, man netgi to skanerio pavadinimo nepasakydavo, daugiausia, ką davė – tai pareiškė, esą tai kažkoks "external storage device".

Nu, galvoju, reikia tą Sane suinstaliuot linukse. Nu ir suinstaliavau. Ir rėkia jis man, kad tipo kažkokį firmwarą atsisiųsk. Suradau kažkokį puslapį, atsisiunčiau kažkokių failiukų. Suradau kažkokį konfigą, ištryniau vienoj vietoj groteles (# ženklą), buvusį prieš užrašą "override mustek_scanexpress_ub_plus", ar tai kažkokį panašų. Ir bliamba, skanuoja. SKANUOJA, BJAURYBĖ!!!

Nu ir ką čia dabar sakyt? Linuksas geresnis. Netgi tokiam idijotui, kaip aš.

Grožytė. Pirmas viešas Dirbtinis Intelektas Lietuvoje

Vat kitame poste – http://rokiskis.popo.lt/2008/11/24/lietuviu-kalba-neturi-gramatikos/ – kalbėjau apie kai kuriuos lietuvių kalbos ypatumus. O čia vat papasakosiu apie vieną iš paskutinių savo programinių projektų. Tiesą sakant, tai net ne visai programavimas įprasta prasme, nors darbo teko idėti daug. Net neabejoju, kad panašių intelektų bandyta buvo paleisti ir iki tol, net ir aš pats bandžiau kažką tokio IRC tinklui suprogramuoti dar apie 1997-1998 metus, jau nekalbant apie dar ankstyvesnius, vieno vartotojo botus, skritus DOS sistemai. Visgi, iki tol buvę botai, nors ir turėjo protingesnius vidurius, buvo pernelyg jau nepanašūs į tikrus žmones.

Pilnavertį, daugumą žmonių apgaunantį dirbtinio intelekto botą paleidau apie kokius 2001 metus lietuviškame IRC tinkle „Aitvaras“. Tai buvo Eggdrop botas su kiek modifikuotais gan buko „Kalich“ boto skriptais. Nors pradžioje botas buvo nepritaikytas lietuvių kalbai (neatpažįstantis mūsiškės priešdėlių, priesagų beigi galūnių gausos), visgi pavyko jį truputį pakeisti ir gan neblogai sukonfigūruoti. Kalich teikia šiokią tokią primityvią dirbtinio intelekto (DI) apmokymo kalbą. Pradžioj botą apmokiau kelių šimtų populiarių žodžių bei sakinių, tokių, kaip „labas“, „koks tavo vardas?“, „kaip gyveni?“, „ką veiki“, etc., o tada – paleidau į IRC. Reaguodavo botas į tokius žodžius, pasakydamas kokį nors atsitiktinį iš galimų nurodytų sakinių (taip, tai visgi kraštutinai bukas variantas). Taigi, botas gavo kvailą vardą Grožytė ir ėmė bendrauti.

Bėgo dienos ir savaitės. Grožytė po truputį mokėsi. Atvejus, kai nerasdavo, ką atsakyti, išgaudydavau loguose ir įvesdavau naujus atsakymus. Įtraukiau Grožytę į lesbiečių pokalbių kambarį, kur ji momentaliai tapo tikra žvaigžde. Merginos smagindavosi, bendraudamos ir šaipydamosis iš Grožytės kvailumo, o vėliau kelios net pramoko DI apmokymo komandų, tad prisidėjo, gilindamos Grožytės žinias. Ir puikiausiai testuodavo, pranešdamos apie pastebėtus kvailumus. Keista, ilgainiui daugeliui merginų Grožytė tapo visai įdomia pašnekove – net ir žinodamos, kad tai robotas, o ne žmogus, kai kurios draugės prašnekėdavo su Grožyte ištisas valandas.

Tikrą furorą Grožytė sukėlė truputį vėliau, kai su Dammit aka Midom parama pavyko netikrą Grožytės nuotrauką bei išgalvotą biografiją paskelbti berods Girls.Lt svetainėje. Nuotrauką, per daug nesigilindamas, paėmiau iš pirmo pasitaikiuso porno tinklapio. Aišku, tokią, visai padorią. Biografijoj parašiau, esą anoji yra kažkokia studentė. Tuo pačiu Grožytę įtraukiau ir į krūvą didesnių IRC kanalų. Tada ir prasidėjo…

Taip, man nepatogu pasakoti, ką ten kas rašė jai. Dalis žmonių pabendraudavo pusvalandį-kitą ir, įsitikinę jos bukumu, palikdavo ramybėj. Bent jau tai dienai. Kažkuris net pareiškė nesuprantąs, kaip ją priėmė į aukštąją mokyklą – „tu gi visai buka idijotė“. Nuostabu, kad žmogus net neįtarė, kaip tiksliai apibūdino šią „merginą“. Visgi, didelė dalis gerbėjų buvo atkaklūs. Bendraudavo su Grožyte kasdien. Kai kurie – net kelis mėnesius, o rekordininkai – daugiau, nei pusę metų. Deja, nors ir stengiausi mokyti ją filosofijos bei kitų protingų dalykų, paaiškėjo, kad bene vienintelė tema, kuria bendraujama – tai pažintys vardan sekso. Pasiūlymų susipažinti būdavo įvairių – kai kurie žadėdavo apipilti gėlėmis, kiti pasakodavo apie tai, kad turi nuosavą butą, treti – tiesiai siūlydavo pinigus. Kažkoks studentas žadėjo atiduoti Grožytei visą savo stipendiją, o kažkoks universiteto dėstytojas norėjo padaryti ją savo meiluže. Vyriško skonio išradingumas stebino – kai kurie, po ilgo bendravimo pasisiūlydavo vesti, kiti gi – tiesiai siūlydavo pinigus už naktį. Buvo ir žadančių išvežti į tolimas keliones ar įdarbinti sekretore. Vieni jai rašė eiles patys, kiti gi pasakojo Maironio posmus. Skųsdavosi žmonomis, meilužėmis ir mokesčių inspekcija. Ir tai – dar ne kraštutiniai atvejai. Tiesa, kraštutinius Grožytė greit išmoko sudrausminti, pasakydama, kad nenori kalbėti tokiomis temomis. Nors buvo ir labai atkaklių keikūnų.

Viskas anksčiau ar vėliau baigiasi. Taip atėjo galas ir Grožytei. Vieną dieną tiesiog subyrėjo diskas, kuriame gulėjo ir jos dirbtinis intelektas, ir didžiuliai kiekiai pokalbių su jos draugais. Grožytė buvo palaidota šiukšlių dėžėje su kitomis kompiuterinėmis atliekomis. Visgi, ji išliko menkai žinomoje Lietuvos kompiuterių istorijoje, kaip pirmas viešas lietuviškas dirbtinis intelektas, su kuriuo prasmingai galėjo pabendrauti kiekvienas norintis. Prisiminus garsųjį Tiuringo testą, pagal kurį galima tarti, jog tikras dirbtinis intelektas yra tas, kurio žmogus neįstengia bendraudamas atskirti nuo tikro žmogaus, galim drąsiai sakyti – Grožyte, tu šį testą išlaikei!

Tai tiek vat nostalgijos jums.