Nowa wyszukiwarka od Google’a – Google Dataset Search

Wyszukiwarka Google’a w tym miesiącu obchodzi swoje 20 urodziny. I od samego początku firmie przyświecał cel skatalogowania i uporządkowania całego internetu.

W Google znajdziemy prawie wszystko. W wyszukiwarce Google Scholar znajdziemy bogactwo materiałów naukowych. W Google Patents możemy poszukiwać patentów. Przyszedł więc czas na skatalogowanie nieindeksowanych z różnych powodów przez crawlery Google’a repozytoriów danych i Dataset Search.

Nic nowego?

Nowa wyszukiwarka została stworzona z myślą o naukowcach, badaczach, dziennikarzach i dla wszystkich tych, którzy na co dzień poszukują różnych zbiorów surowych danych w sieci.

Obecnie wyszukiwarka jest w fazie testów i sprawia wrażenie bardzo podobnej do zwykłej wyszukiwarki Google. Oczywiście tak nie jest. Dostępne jak na razie jest tylko wyszukiwanie proste. W polu wyszukiwawczym standardowo wpisuje się czego poszukujemy, a w trakcie wpisywania podświetlają się podpowiedzi. Strona z wynikami wyszukiwania to rozwijalna lista wyników po lewej stronie i rekord wybranego wyniku z listy po prawej stronie.

dataset search

Standardy i indeksowanie

Ponieważ wyszukiwarka Google nie indeksuje wszystkich stron pojawiających się w internecie, gigant z Sillicon Valley stworzył do tego celu nowe narzędzie. Dataset Search ma ułatwiać dostęp do niezliczonej ilości repozytoriów. Jednak, aby ten typ źródeł został poprawnie i w ogóle zaindeksowany przez nową wyszukiwarkę, twórcy stworzyli poradnik. Poradnik czyli wytyczne dla osób zarządzających różnymi zbiorami danych, informujący, jak poprawnie opisać swoje źródło danych, aby nowe narzędzie od Google’a mogło je zaindeksować. A jeśli zostanie zaindeksowane, będzie wyświetlane w pasujących do zapytań wynikach wyszukiwania.  

Opis zbioru danych, dotyczy m.in. autora zbioru, miejsca publikacji oraz sposobu zgromadzenia przechowywanych danych. Informacje te, wyświetlają się również na liście wyników. Schemat tego opisu opiera się na otwartym standardzie schema.org, stworzonym m.in. przez Google, Microsoft, Yahoo oraz Yandex.

 

Ponieważ to dopiero początki porządkowania rozsianych po „całym internecie” danych, nie wszystkie zapytania mogą zwracać zadowalającą liczbę wyników. Bogactwo wyników na liście wyników w Dataset Search na pewno zwiększy się z czasem, przypominając wyniki ze standardowej wyszukiwarki Google’a.