Tag Archives: statistika

Mokslas ir pseudomokslas Sovietų Sąjungoje

Sovietų Sąjungos mokslą valdė ideologija ir politika, persimaišiusi su tiesiog nevėkšliškų aktyvistų kliedesiais ir nuolatinėmis valdžios veikėjų intrigomis. Todėl mokslinė realybė egzistavo tik tiek, kiek jai leisdavo egzistuoti režimo ideologai. Jei kažkokiems ideologams kas nors nepatikdavo, jie pareikšdavo, kad kokia nors mokslinė kryptis esą yra pseudomokslas – o jau tada tuos menamo pseudomokslo atstovus išrepresuodavo. Į visokius mokslinius postus šitaip pakliūdavo visokie intrigantai, o vietoje realaus mokslo atsirasdavo pseudomokslinės teorijos.

Buvo tokių mokslo sričių, kur SSRS visgi pasiekė nemažai. Beveik visos tos mokslo sritys buvo labai stipriai susijusios su karo pramone. Tiesiog ginklai režimui buvo tokie svarbūs, kad jais užsiimantiems mokslininkams valdžia leisdavo neužsiimti ideologiniais kliedesiais. Bet ten, kur kariškių įtakos nebuvo, šarlataniškas pseudomokslas siautėjo nevaldomai.

Buvo tokių mokslo sričių, kur SSRS visgi pasiekė nemažai. Beveik visos tos mokslo sritys buvo labai stipriai susijusios su karo pramone. Tiesiog ginklai režimui buvo tokie svarbūs, kad jais užsiimantiems mokslininkams valdžia leisdavo neužsiimti ideologiniais kliedesiais. Bet ten, kur kariškių įtakos nebuvo, šarlataniškas pseudomokslas siautėjo nevaldomai.

Bene ryškiausiai visas šitas „pseudomokslų“ naikinimas vyko Josifo Stalino laikais, kai banaliai uždrausta buvo genetika, kibernetika, psichoterapija, kvantinė fizika, Einšteino reliatyvumo teorija, o kalbų atsiradimas būdavo aiškinamas kažkokiais darbiniais šūkavimais. Kai kurios to meto sovietinės „mokslo“ teorijos buvo tokios absurdiškos, kad dabar jas prisimenant, sunku patikėti, kad tai išvis galėjo būti.

Skirtingi draudimai, apribojimai ir iškraipymai būdavo skirtingais sovietmečio periodais. Tarpais draudimai, neigimai ir ribojimai būdavo labai dideli ir ilgalaikiai (kaip, pvz., psichoterapijos ar genetikos atvejais), o tarpais – kažkas būdavo draudžiama tik viešumoje, tuo pat metu kuriant atitinkamos mokslo srities institutus (pvz., kaip kvantinės mechanikos, branduolio fizikos ar vėlesnių laikų genetikos atvejais). Viskas priklausydavo nuo to, kiek smarkiai kurios nors mokslo srities reikėdavo režimui. Bendrai žvelgiant, Stalino laikais dominavo įvairūs šarlatanai, kurių Brežnevo laikais jau liko nedaug. Kita vertus, Brežnevo laikais viską valdė neįtikėtinas atsilikimas ir stagnacija, kur vietoje mokslo atsirado tiesiog biurokratinė popierių kūryba.

Keista, tačiau kai kurios sovietinio mokslo absurdų nuoplaišos retkarčiais dar išlenda į paviršių, nors jau praėjo daugybė metų. Nesąmonės linkę ilgai gyvuoti.

Continue reading

Kodėl padidėjo sąskaitos už šildymą? Nr.7: pardavimų valdymas, faktai ir statistika

Pingvinai šildosi

Aš čia nekomentuosiu apie tokį šildymą, bet jis irgi smirda

Kiekvienas su pardavimų organizavimu ką nors bendra turėjęs žino, kad esami klientai skirstomi į tris grupes, su kuriomis reikia elgtis skirtingai:

  1. Tie, kas perka mažiau, nei galėtų. Jiems reikia pardavinėti kiek įmanoma daugiau – svarbu tik, kad jie imtų daugiau pirkti, nes jų sąskaita galima smarkiai padidinti pardavimus.
  2. Tie, kas perka daug. Jais pernelyg rūpintis nereikia, svarbu tik tai, kad jie neimtų pirkti mažiau. Šios grupės sąskaita pardavimų smarkiai padidinti nelabai įmanoma, nes jie jau ir taip perka pagal galimybes.
  3. Tie, kas perka neadekvačiai daug. Jiems reikia apie save geriau jau išvis nepriminti, kad netyčia nesusiprastų tvarkytis savo pirkimų. Jei toks klientas pats pastebi, kas pas jį dedasi ir dėl to bando kažką keisti, jam galima netgi truputį padėti – su sąlyga, kad nesmarkiai. Jeigu jo sąnaudos sumažės kokiu dešimtadaliu, jos visvien liks didesnės už vidurkį, tačiau klientas bus laimingas ir patenkintas.

Tokios trys klientų grupės yra pas visus, kas tiktai kažką parduoda. Tokios trys grupės klientų yra ir pas šilumos tiekėjus. Tik kad pastarieji jau yra monopolistai, t.y., naujų klientų paieškos jiems nereikia, o įtikinti pirkėjų, kad tie pirktų daugiau – nesigauna. Todėl jiems telieka suktis kažkaip kitaip. Pavyzdžiui, aš taip daryčiau:

  1. Tiems, kas šilumos naudoja mažiau, nei galėtų – galima kaip nors padidinti šildymo sąnaudas. O paskui atsiųsti pas juos kokį nors merą, kuris imtų skleist vėjus apie tai, kad namas prastai tvarkosi su šildymu, o kaltas dėl to tikrai ne šilumos tiekėjas, o arba koks nors energetikos ministras (lyg ministras sukiotų kranelius), arba namo administratorius.
  2. Tie, kas šilumos naudoja daug – jų geriausiai ir toliau pernelyg netampyti. Svarbu, kad jie ir toliau neimtų pirkti mažiau, tačiau pardavimus jiems reikia didinti atsargiai ir apgalvotai.
  3. Tų, kas šilumos naudoja išvis neadekvačiai – galima ir toliau neliesti. Bet jei jie susiprastų ir imtų skųstis, dėl gražaus vaizdo galima padėti jiems truputį sumažinti sąnaudas. Visvien toks eikvos nenormaliai daug, bet patikės, kad juo rūpiniesi. O paskui dar bus galima paskelbt apie juos, kad esą kažkam padėjom.

Žodžiu, ta pardavimų segmentacija yra labai elementari ir puikiai žinoma kiekvienam, kas tik bent truputį turėjo reikalų su klientų priežiūra iš pardaviminės pusės. Ypač tokia schema yra tipiška paslaugų teikėjams. Bet nesigilinkim, nes tokie segmentavimai yra vadybiniai dalykai, kurie išties mums visiškai neįdomūs, nes mes juk kalbame ne apie vadybą, o apie šildymą.

Ai, arba dar pavyzdys: kaip pakelti kainas supermarkete 10%, jei vartotojai pyksta, kad viskas labai brangu? Taigi labai paprasta: pusei atsitiktinių prekių kainas sumažiname 10%, likusiai pusei padidiname 20% ir paskelbiame reklamą apie tai, kad pusės prekių kainos sumažėjo. Ir dar būtinai prie kiekvienos taip atpigintos prekės parašom, kad ji dabar pigesnė. O kad kartais kas nors neįtartų, galima padaryti ir atsitiktinius padidėjimo-sumažėjimo dydžio išbarstymus, o galima ir pasegmentuoti prekes pagal dalį apyvartoje, jų rinkos elastingumą ar dar kokius nors dalykus.

Ai, bet mes čia juk nukrypome nuo temos, nes kalbame ne apie pardavimus, o apie šildymą, tiesa?

Continue reading

Kodėl padidėjo sąskaitos už šildymą? Nr.6: kas taupo, tam didėja.

Jaučiu, prieš Kalėdas taip ir nespėsiu parašyti apie tai, kodėl ir kaip, nors apie to šilumos sukiojimo metodus, galimybes bei atsakomybes jau šį bei tą rašiau. Bet užtat duosiu jums vieną smagų grafikėlį, po kurio tiems, kas jį supras, jau klausimų nekils. Ir nekils klausimų apie visokius fufelius, kai koks nors meras kaltina blogu administravimu tuos, pas ką sąskaitos padidėjo.

Su sąlyga, kad savivaldybė paskelbė duomenų, o taip pat juo labiau, kad Commonsense.lt išsisaugojo tuos duomenis, čia jums grafikėlis, kuris pasako viską už viską. Įdėmiai pažiūrėję į šį grafikėlį, galėsite užtikrintai vadinti šilumenininkus įvairiais jūsų pasirinktais žodžiais:

Šilumos suvartojimo pasiskirstymas ir pasikeitimai 2010-2011 metais

Štai čia žiūrėkit ir medituokite dabar į šitą grafikėlį. Žiūrėkite ir medituokite. Žiūrėkite ir medituokite apie tai, kodėl pasikeitė trendų kryptys. Ir kodėl jos taip keistai pasikeitė.

Aš čia jums nieko neaiškinsiu kol kas. Jūs patys kol kas pažiūrėkite, pamedituokite ir pasidarykite sau išvadėles kokias nors. Bet žinokite vieną dalyką: aš nesiruošiu nusižudyti, aš esu labai atsargus ir neturiu jokių šansų pakliūt į nelaimingus atsitikimus, o taip pat aš niekuo nesergu. Ir taip pat jokiems plėšikams nėra jokio pagrindo manęs žudyt ar užpult.

Google Analytics, ar verta?

Nežinau, kaip čia man taip gaunasi, bet aš, matomai, esu senas IT degeneratas, atsisakantis visokių naujovių visur, kur tik galima ir kur įmanoma. Tai vat, dabar užsiregistravau kažkokį ten Google Analytics akauntą. Tai pažiūrėsiu, kokios tenai statistikos (ir žinoma, kad niekam nesakysiu). Ar vertėjo man tai daryt?

Šiaip tai nežinau, gal ir neblogi tie analytiksai bus. Gal ir nėra tas Google blogis baisus. Ką aš žinau. Čionai PoPo.lt ir taip kažkokios statistikos yra, tik aišku, ką jos rodo – tai rodo pagal savo logiką. Tai nei nežinau, kiek tai atitinka Google Analytics suskaičiuojamus skaičius. Įtariu, kad gali skirtis keliom dešimtim procentų ir į vieną, ir į kitą pusę.

Nors gal ir verta pasižiūrėti tą Google statistiką. Nors aišku, kokia nauda – irgi nežinau. Ką man tie skaičiai gero pasakys? Trumpai tariant, kažkokias gal beprasmes nesąmones darau, nesu tikras. Kas nors naudojate Google Analytics?

Valstybinės Lietuvių kalbos komisijos darbo kokybė, statistinis vertinimas

Pasitaikė man toks dokumentas – „Valstybinės lietuvių kalbos komisijos protokolinis nutarimas dėl svetimžodžių atitikmenų sąrašo“, pasirašytas VLKK vadovės Irenos Smetonienės 2010 spalio 28 dieną.

Nesigilinsiu šį kartą į tai, ką ten prigalvoję yra kaitalioti (kaip visada, priežasčių pasijuokimams galima atrasti), tačiau pabandžiau tiesiog formaliai skaitiškai įvertinti tos komisijos darbo kokybę – kiek jie makliavoja, o kiek nuoširdžiai stengiasi. Kriterijus – labai paprastas: siūlomų keisti svetimžodžių pasiskirstymo atitikimas prognozuojamam statistiniam svetimžodžių paplitimui.

Prielaidos paprastos: pagrindinis svetimžodžių šaltinis šiuo metu yra anglų kalba. Taigi, galime tikėtis, kad lietuvių kalbos gaunamų svetimžodžių pasiskirstymas turėtų ganėtinai stipriai koreliuoti su pačios anglų kalbos žodžių pasiskirstymu. Pavyzdžiui, paprasčiausiu atveju – pagal pirmąją žodžio raidę.

Tuo atveju, jei VLKK dirbtų kokybiškai, sistemingai ir organizuotai ieškodama plintančių svetimžodžių bei pakaitalų jiems, dažniniai nuokrypiai nuo anglų kalbos pasiskirstymo turėtų būti ganėtinai saikingi, didele dalimi grafikai turėtų sutapti. Priešingu, prasto darbo atveju, turėtume gauti visiškai neatitinkančius pasiskirstymus.

Taigi, sumetam lentelę iš to dokumento, paskaičiuojam, sumetam greta angliškus pasiskirstymus ir gauname štai ką:

Svetimžodžių pasiskirstymas pagal VLKK

Grafikas vaizduoja lietuvių kalboje keičiamų svetimžodžių pasiskirstymą pagal VLKK (raudona) ir anglų kalbos žodžių pasiskirstymą (mėlyna)

Kaip matome, bendros koreliacijos nematome. Visiškai. Dar daugiau, įspūdis toksai, kad pradedant abėcėlės pirmomis raidėmis, VLKK dar bando dirbti aktyviai, tačiau įpusėjus abėcėlę, nuleidžia rankas ir daugiau jau nesistengia. Negana to, labai keistai atrodo kelių raidžių trūkumai – toks vaizdas, kad ieškant svetimžodžių, dirbta buvo visgi pagal konkrečias raides (t.y., ar tai kažkokiems darbuotojams paskirta rankioti svetimžodžius, ar šiaip, bet paraidžiui), tačiau dėl kažkokių neaiškių priežasčių kelios svarbios raidės tiesiog prapuolė. Fenomenaliai atrodo „a“ raidė – nors ir pirma, sąrašo pradžioje, tačiau visiškai menkai teparankiota.

Toliau esantys skirtumai tarp angliškų ir lietuviškų „b“, „c“, „d“ (praleidžiam iškrentančią „e“) ir paskui dar ir „f“ bei daugmaž „g“ – savo santykiais koreliuoja tarpusavy, t.y., atrodo, kad su šiomis raidėmis buvo dirbta kokybiškai, nuosekliai, jų santykiai atitinka ir mūsų darytą prielaidą apie atitikimą tarp svetimžodžių ir angliškų žodžių pasiskirstymo, patvirtindami, kad šito mūsų tyrimo konceptas teisingas.

Su „h“ raide jau prasideda kažkokie bardakai – bene vienintelė procentiškai atitinkanti raidė tampa išimtimi iš bendro grafiko. Su „i“ raide – išvis nei vieno svetimžodžio nerasta. Su „o“  – irgi. O juk šiomis raidėmis prasidedantys žodžiai užima 5-ą ir 6-ą vietą pagal populiarumą anglų kalboje. Dar kartą prisiminkim „a“ raidės fenomeną. Su juo palyginus, „w“ bei „l“ jau atrodo nekaltai.

Galų gale, dar toliau – išvis nelieka jokių abejonių: „t“ raide prasidedančių svetimžodžių VLKK atranda mažiau, nei atrado prasidedančių „b“, „c“ ar „f“ raidėmis. O juk „t“ raide prasidedantys anglų kalbos žodžiai – populiariausi. Kiek čia mums gaunasi? Maždaug keturių kartų skirtumas. Keturių kartų neatitikimas yra labai didelis, sakyčiau, užribinis, abejoti neleidžiantis. Kad tai nėra kažkokia fluktuacija, abejot neleidžia „m“, „s“ ir „w“ santykiai, kurie irgi panašūs.

Taigi, VLKK darbas, sprendžiant pagal statistinės atitikties realybei vertinimą, yra prastas, o pagal gautus duomenis (t.y., raidžių pasiskirstymų pobūdį) galime spėti, kad ten yra labai nemenkų organizacinių bėdų, susijusių su konkrečių užduočių vykdymu. VLKK dirba nesistemingai, prastai planuoja savo veiklą ir prastai kontroliuoja savo pačios darbą.

Ar ką nors bent truputį nustebinau?

Upd.: dar rūšiuotas grafikas pridėtas, kad kitu būdu pažiūrėt, aiškiau matosi pasiskirstymų neatitikimas.