Big data on the big data!
Не. Няма да се правя на специалист, но с радост споделям, че успях да намеря и разговарям с такъв, и то представител от световна компания, на местна почва. Какво е big data? Защо има такова голямо значение за всеки един от нас, освен във времената на технологичен подем, a и в рамките на поумняващите урбанистични структури? Как ни помага и дори спасява човешки животи?
Разговарям със Стил от AtScale, където решават проблема с big data и чийто най-голям офис е вече в България. Компанията, на чело, на която е този #techrockstar – Кристофър Линч @LynchBigData, който препоръчвам на всеки интересуващ се от бъдещето и неизменно свързаните с него технологии да последва:
"At #AtScale, I don’t control the macro markets, I don’t control civil unrest, I don’t control the pandemic. But I do control how I behave & lead the company…" Catch @LynchBigData in @DataRobot's latest #podcast episode, "There is No Compromise." https://t.co/AGWkbcRXNP
— AtScale (@AtScale) November 10, 2020
Би ли се представил на нашите читатели?
Казвам се Стилиян Еленков и съм директор Инженерна дейност в AtScale, където се занимаваме с анализ на big data. Нашият продукт улеснява анализа на акумулирана информация, бизнес данни от различни източници, с цел исторически анализ и бъдещи прогнозируеми предпоставки за развитие.
Big data е доста нашумял термин. Разкажи ни за трендовете.
В това направление има два тренда към момента. Единият е когато всеки бизнес акумулира собствена информация – продажби, тенденции и пр. от различните отдели, като по-голямата част от тази информация, която ние наричаме data silos. Това е информация, която се съхранява в отделните звена. Например, отдел продажби си има собствено silo, съответно отдел маркетинг също и т.н. Доста често това, което се случва е когато Изпълнителният директор зададе въпроса „Колко продадохте миналия месец?“, получава различни отговори. Именно, защото всеки си интерпретира информацията по различен начин или си има отделно silo. Ние решаваме точно този проблем. Правим централен модел, който може да борави с всички тези различни източници от отделните подразделения, които имат различни местонахождения на базите данни, агрегираме тези различни източници на данни в един централен и съответно единен модел на изходна информация.
Освен това все повече се предлага възможността бизнеса да си закупи публична информация (data). Освен информацията, с която разполага вътрешно от собствената си дейност, ако бизнеса иска да си закупи публична информация от Световната Здравна Организация, например или държавни органи. За едни тази допълнителна информация би могла да бъде – какво е използването в различните часове на деня на градски транспорт, какъв е пътникопотока в дадена локация и т.н.
Наскоро имахме много интересен случай с Taco Bell – верига заведения за хранене, конкретно в САЩ. Те поискаха да анализират пътникопотока около локациите си по време на Covid изолационния период, съответно да предвидят и последствията, ако когато държавната администрация премахне рестрикциите. За целта им трябваха данни от множество източници, които можеш да си закупиш от Amazon, Google и пр. за да допълниш собствените си данни, особено на фона на настоящото нестабилно положение.
Бях чела, че вашата дейност е помогнала много при Covid кризата в САЩ. Как?
Ние взехме данни от различни институции, държавни и частни като например Boston Medical Center. Акумулираните данни навързахме в един модел, който предоставихме не само на правителството и неправителствени организации в САЩ, но и по други места в света, за да може да проанализират, проследят взаимовръзките и прогнозират по-добре. Тук боравихме с информация не само за брой заразени, но и взаимодействие между хората, транспорт, пътникопоток, брой хора посетили медицински кабинети по причини не свързани с Covid и т.н. Интересното беше, че хората се страхуват да отидат на лекар, въпреки че имат сериозни здравословни причини да го направят. В същото време, ако не отидат нещата стават дори по-лоши. Оказва се, че голяма част от смъртните случаи са именно поради тази причина- хората просто се страхуват да посетят медицински център и се влошават, не рядко с фатални последици.
Работиш в международна компания не за пръв път. Интересът ти и вярата в бъдещето на технологиите е водещ. До какви най-интересни географски ширини и проекти са те отвеждали служебните ангажименти?
Преди около 15 години работих за една щатска компания, която се занимаваше тогава с автоматизация на големи музейни колекции и библиотеки. За времето си тогава въвеждахме много интересна технология RFID, това са онези закрепени за стоката неща с намотки, които познаваме днес от магазините, предпазващи от кражба посредством звуков сигнал при излизане, ако не е свалена. Тогава, съвсем в началото, слагахме такива устройства, инвентаризирайки огромни колекции посредством едни роботчета, които минаваха по редовете с книги, сякаш с вълшебна пръчка. По този начин сам си заемаш и връщаш книги от такива автоматизирани будки и избягваш чакането по опашки. Съответно съм правил това и за музеи по света с огромно количество експонати, които се инвентаризират, каталогизират и пр. Имплементацията на този продукт ме отведе директно при клиентите от локации като Сингапур, Осака, Токио, Москва, Монреал, Кеймбридж, където правихме интересни неща в университета също като Упсала, университетски град в Швеция, Куала Лумпур, Банкок и т.н.
Макар и преди сравнително дълъг период от време, бях много впечатлен от Токио, най-големият мегаполис в света с население от 37 милиона души, в т.ч. прилежащата метро зона. Това е 30% от населението на Япония. Сградите са колосални, транспорта варира от високоскоростни влакове, надземна железница, метро, няколко магистрали, които се пресичат в града, разбира се уличен трафик и пр. Без автоматизация един такъв град е изключено да има порядъка на Токио. Веднага ще станат немислими задръствания, които в момента няма, сравнено с малка София. Отделно въздухът не е толкова замърсен, колкото при нас.
Дигитализацията е важна за онзи най-начален етап при преминаването на градовете ни към интелигентни единици, но е толкова бавна, че хората не рядко я считат за невъзможна на местна почва.
Дигитализацията е неизбежна в един момент. Дори Турция е на път към електронно правителство, което означава, че е напълно осъществимо навсякъде.
Най-големият офис на компанията, в която си към момента е именно в България и вашият фокус е данни. Как съблюдавате за моралът на служителите си, по Теодосий Теодосиев от това мое интервю? От самото интервю за позицията ли започва процесът?
Ще дам пример с барута. Китайците са го ползвали стотици години за фойерверки, след което са започнали да го използват и за оръжие. Т.е. въпросът е как се използва, точно като с технологиите.
Четох много интересна статия наскоро как хората протестират срещу Google & Amazon, за това че им се събират данните. Как протестират ли? Това, което правят е да си инсталират приложения, които да кликат на всички реклами постоянно, с което правят т.нар. data poisoning или объркване на алгоритмите на тези големи играчи. И това работи. Така вече имаме възможност да бъдем отведени до масата за преговори, където можем да сме равнопоставени дори и във взаимното извиване на ръце.
Използването на технологии и съответно лични данни е въпрос на social contract, подобно на този, който имаме в момента с някакъв тип управление. Добре е, че все пак сме в Европа, защото тук имаме някакъв допълнителен слой на защита от подобна манипулация.
Аз като цяло съм оптимист и вярвам, че доброто в хората ще надделее.
Относно моралът, това започва от самото интервю при нас. Трудно е да отсееш, но сме отказвали например на много добри специалисти, които идват от определени индустрии, където нивото на морал не винаги е високо, колкото ни се иска. Разбира се, всеки може да каже, че е нормално и те работят за пари, но не е така. Човек има право да избере работа, която да отговаря на ценностите му и ние определено следим за това. Има хора, които предпочитат да живеят с по-малко доходи, но чиста съвест спрямо собствените си критерии, разбира се. И ние се опитваме да изградим екип именно от такива принципни хора. Никак не е лесно. Аз правя около 10-15 интервюта на седмица – особено лятото. Това са средно по 3 срещи, всяка с продължителност от около час-час и нещо. Ако трябва да посоча в цифри, приблизително 1 от 20 ни е попадението. Доста работа, но според мен си заслужава. Хубавото е, че много от тях са привърженици на класическите ценности, въпреки вярата им в светлото тек бъдеще.
Спомена социален договор и това е интересно, когато става въпрос за използване на данни. Моля те, обясни повече.
При този договор давам данните си, но същите могат да бъдат използвани само и единствено за конкретни, съгласувани с мен неща, за които съм дал съгласието си предварително.
В противен случай големите на пазара ги взимат и ползват за каквото си поискат. При наличието на добър социален контракт, който ти дава начин да повлияеш и си търсиш правата при неправомерно използване, това ще бъде решено много бързо. Тук, с риск да прозвучи странно, блокчейн технологиите могат да бъдат много полезни. Не самата технология, а че този социален контракт може да бъде част от блокчейн технология. И както ползвателя, така и предоставящия информацията си да могат да енфорсват начина, по който тя се ползва. Ако се стигне до там, това ще бъде решено много лесно. Друг начин виждам в това да се анонимизират тези данни или термина, който използваме ние е obfuscation – най-чувствителната част от информацията да бъде прикрита. Това обаче не винаги помага, но голяма част от данните могат да бъдат съхранени така.
За събирането на голяма част от изходни данни необходими за въвеждането на един град към интелигентно развитие не е необходимо дори събирането на лични данни. Такива свързани с пътникопоток, сметоизвозване, датчици за отчитане качеството на въздуха и пр. са напълно достатъчни в самото начало. Но за да сме напълно ефективни ще трябва в последствие и начинът е въпросния social contract, като магна карта. И двете страни си имат своите права и отговорности. В момента, на практика тези, които събират информацията имат само права, но не и отговорности. Това обаче е нормално, защото технологиите се развиват стремглаво и особено сравнено със законодателството, което трябва да навакса. Нормална в исторически аспект цикличност от типа – лъкът като се направи така, че да пробива по-дебела броня, следващата, която ще бъде измислена е още по-дебела и непробиваема. Вярвам, че нещата ще се урегулират.
Какво според теб от развитието към умен град трябва да се случи първо в България и какво в технологично отношение нямаш търпение да видиш действащо, ако е различно?
Според мен трябва да се започне с обучение в дигиталните технологии на държавната администрация. Това е начинът тя да започне да напредва в тази посока за да съответства в един момент на цялостното развитие. От друга страна, гражданите все повече се самообразоват в това отношение и искат да си направят нещата онлайн, да не се редят по опашки, но голяма част от тях също трябва да бъдат обучени като потребители.
Иначе, моят личен проблем е с неоптималното разрастване на София. Строителството е извън всякакъв контрол. Наложи ми се да подам жалба срещу представители на строителен обект, който според табелите на терена разполага с разрешение за такова. След месец и половина получих отговор, че разрешение няма. Тъй като това е публична информация, след оплакване онлайн би следвало да получа отговор до минута.
Мисля, че когато и гражданите, и бизнеса разберат, че по този начин губят всички страни, ще се стигне до по-добра реалност в името на напредъка.
Към момента вече има датчици за замърсяване на въздуха, за пътникопоток, за автомобили, за пътници на превозни средства от градската мрежа, старт на 5G и пр. Това много помага на бизнеса, защото градската среда става предвидима. Събирането и обработване на тази информация е нещо, от което не се възползваме, а би трябвало. Това би допринесло за всички страни, но хората трябва да имат възможност за образование.
Твоите прогнози за развитие в предстоящите 5 години?
Аз много пъти съм заявявал, че България може да бъде по-хубава и от Швейцария. Въпрос на политическа воля за бързото случване на нещата, дори изпреварващо мнозина и на организация. Виждам напредък в София, но с много бавни темпове. Иначе в правилната посока.
Проблемът беше първоначално с окабеляването на датчиците и връзката им с централни сървъри. След въвеждането на 5G това ще става все по-лесно и по-лесно. Може би, именно пандемията е този катализатор.