Po co Google taka baza danych?

Programy Google zbierają informacje ze wszystkich zakamarków sieci i umieszczają je w bazie danych. Fakty dotyczą zjawisk, rzeczy, osób... - pisze Piotr Kościelniak.

Publikacja: 13.09.2014 05:38

Informacji jest zbyt dużo nawet jak na najpotężniejsze centra przetwarzania danych

Informacji jest zbyt dużo nawet jak na najpotężniejsze centra przetwarzania danych

Foto: AFP

System nosi nazwę Knowledge Vault i na razie przechowuje ok. 1,6 miliarda faktów. 271 milionów informacji automaty oceniły jako „potwierdzone", czyli z 90 - proc. prawdopodobieństwem prawdziwe.

Po co Google taka baza danych? To proste – gdy wpiszemy w wyszukiwarce internetowej dowolne pytanie, system wyświetli nie jak obecnie listę stron zawierających informacje, ale od razu odpowiedź. I to bez konieczności sprawdzania danych w sieci – weźmie je z własnych zasobów.

Tylko na pozór zmiana jest kosmetyczna. W rzeczywistości to rewolucja, która może zmienić każdą dziedzinę naszego życia.

Obecnie Google wykorzystuje podobną bazę danych nazywaną Knowledge Graph. Zawiera ona informacje wybrane (i edytowane) przez ludzi z licznych internetowych źródeł – m.in. z Wikipedii i CIA World Factbook. Zaprezentowana oficjalnie w 2012 roku funkcja dostępna jest jednak tylko w kilku najpopularniejszych językach świata. Zawiera też ograniczoną liczbę „faktów" – tu czynnikiem hamującym budowanie większej bazy danych byli ludzie.

Dlatego ich wyeliminowano. W Knowledge Vault dane zbierają i sprawdzają programy – algorytmy potrafią wyciąć z tekstu informację i porównać ją z innymi, oceniając jej wiarygodność. Na razie liczba informacji zebranych automatycznie jest mniejsza niż tych edytowanych przez ludzi. Ale to tylko kwestia czasu. Ponadto internetowe roboty Google mają dostęp do informacji niedostępnych publicznie: danych udostępnianych w Google+, przesyłanych w listach Gmail czy publikowanych na YouTube (wszystkie te serwisy należą do imperium Google). Inna sprawa – czy ludzie z Google będą z nich korzystać.

To tylko badania

O Knowledge Vault jako pierwszy poinformował magazyn „New Scientist", opierając się na dokumentach z konferencji naukowej dotyczącej analizy informacji w bardzo dużych zbiorach danych. Po opublikowaniu materiału na ten temat przedstawiciele ?Google poprosili o uzupełnienie go informacją, że firma nie wykorzystuje w tym programie żadnych osobistych danych.

Później Google w ogóle uznał, że informacje dziennikarzy są „przekręcone" i stanowią złą interpretację naukowego artykułu inżynierów.

Firma poproszona przez „Rz" o komentarz wyjaśniła, że program Knowledge Vault został zaprezentowany na współorganizowanej przez Google konferencji Automated Knowledge Base Construction w październiku 2013 roku, a oficjalna publikacja pojawiła się w maju tego roku. Technologia ta nie jest wykorzystywana w żadnym produkcie ?Google, jest to jedynie program badawczy analizujący dane publicznie dostępne w internecie – zapewniają nas przedstawiciele firmy.

Usprawnienie wyszukiwarki internetowej Google to tylko wierzchołek góry lodowej. Knowledge Vault – o ile Google zdecyduje się wprowadzić tę technologię do komercyjnych produktów i usług – udoskonali na przykład cyfrowych osobistych asystentów. Dziś takie programy, jak Apple Siri, Google Now czy Cortana Microsoftu, mają ograniczoną użyteczność. Ale jeżeli algorytm będzie potrafił ocenić, które rzeczy są ważne, prawdziwe, czy niosą realną informację, „inteligencja" asystentów wzrośnie skokowo.

Inteligentny asystent

„Zanim upłynie dekada, będziemy mieli na przykład inteligentne skrzynki pocztowe pokazujące nam tylko dziesięć najważniejszych listów. Z resztą poradzą sobie same, nawet nie będziemy musieli ich otwierać" – prognozuje w „New Scientist" Tom Austin, analityk firmy Gartner.

Inny pomysł to zbieranie informacji o parametrach pracy organizmu – na przykład przez czujniki inteligentnego zegarka. Takie zegarki są już dostępne, mogą zmierzyć np. puls, jakość snu, temperaturę itp. Sztuczna inteligencja wyposażona w wiedzę medyczną może na bieżąco monitorować nasze ciała i jeżeli zaobserwuje coś niepokojącego, wyświetlić ostrzeżenie na ekranie zegarka.

Co jeszcze? „Knowledge Vault może być fundamentem systemu dostarczającego informacje użytkownikom inteligentnych okularów. Będzie wyświetlać informacje o zabytkach, budynkach, okolicznych restauracjach nałożone na obraz świata rzeczywistego" – mówi Fabian Suchanek, francuski inżynier, uczestnik konferencji, podczas której pracownicy Google prezentowali nowy pomysł. Takie okulary też już zresztą istnieją – to nic innego jak Google Glass. Zdaniem Suchanka analiza ogromnych ilości danych pozwoli również na przełom w socjologii i psychologii. Możliwe stanie się modelowanie zachowań społecznych, a także ich przewidywanie na podstawie poprzednich zdarzeń.

W krótszym okresie baza wiedzy pozwoli Google uwolnić się od jakichkolwiek dostawców treści. Na większość pytań wpisywanych w wyszukiwarkę Google będzie w stanie odpowiedzieć, nie sięgając do zasobów zewnętrznych. Rola instytucji i osób publikujących informacje w internecie jeszcze bardziej spadnie.

Google nie jest jedyną firmą prowadzącą prace nad podobną technologią. „Microsoft, Facebook, Amazon i IBM budują podobne. I wszyscy napotykają ogromne problemy, o których dziesięć lat temu nawet nie mieliśmy pojęcia" – mówi magazynowi „New Scientist" Tom Austin, analityk firmy Gartner.

Potrzebny superkomputer

Na przykład IBM dysponuje systemem eksperckim Watson składającym się z superkomputera oraz bazy informacji. Bazę danych można wymieniać w jednej chwili, zmieniając Watsona z eksperta w sprawach finansowych w doskonałego diagnostę medycznego. Watson zresztą już to robi – ma dostęp do milionów artykułów medycznych, opisów przypadków, podręczników i pomaga diagnozować raka w Memorial Sloan Kettering Hospital.

Podobną bazę danych dla cyfrowej asystentki Cortana i wyszukiwarki Bing tworzy ponoć Microsoft. A Facebook wykorzystuje informacje udostępniane przez miliard swoich użytkowników, aby lepiej reklamować miejsca, produkty i usługi, z których korzystali nasi znajomi.

Ostatnim elementem tej układanki jest centrum przetwarzania danych i superkomputery zdolne na bieżąco analizować dane i przedstawiać wyniki użytkownikowi. Internetowy gigant poinformował właśnie o rozpoczęciu współpracy z inżynierami Uniwersytetu Kalifornijskiego w celu stworzenia komputera kwantowego. Takie maszyny, wykorzystujące do działania zupełnie inny mechanizm niż tradycyjne komputery oparte na układach krzemowych, teoretycznie byłyby w pewnych zadaniach miliony razy szybsze niż obecnie.

Firma Google współpracuje również z D-Wave Systems, innym producentem eksperymentalnych komputerów kwantowych, od którego wspólnie z NASA kupiła sprzęt. Zespół sztucznej inteligencji kwantowej oczywiście również prowadzi wyłącznie „program badawczy".

System nosi nazwę Knowledge Vault i na razie przechowuje ok. 1,6 miliarda faktów. 271 milionów informacji automaty oceniły jako „potwierdzone", czyli z 90 - proc. prawdopodobieństwem prawdziwe.

Po co Google taka baza danych? To proste – gdy wpiszemy w wyszukiwarce internetowej dowolne pytanie, system wyświetli nie jak obecnie listę stron zawierających informacje, ale od razu odpowiedź. I to bez konieczności sprawdzania danych w sieci – weźmie je z własnych zasobów.

Pozostało 92% artykułu
Materiał Promocyjny
Kod Innowacji - ruszył konkurs dla firm stawiających na nowe technologie w komunikacji z konsumentami
https://track.adform.net/adfserve/?bn=77855207;1x1inv=1;srctype=3;gdpr=${gdpr};gdpr_consent=${gdpr_consent_50};ord=[timestamp]
Materiał Promocyjny
Polska na czele rewolucji technologii kwantowych
Nowe technologie
Niewykrywalny bombowiec strategiczny Sił Powietrznych USA odbył pierwszy lot
Nowe technologie
Co mówią kury? Naukowcy opracowali tłumacza, użyli sztucznej inteligencji
Materiał Promocyjny
Bank Pekao wchodzi w świat gamingu ze swoją planszą w Fortnite
Nowe technologie
Prof. Zybertowicz: AI może potraktować ludzkość jak budowniczy autostrad traktują mrowiska