Jestem pod wielkim wrażeniem tego co znalazłem w statystykach odwiedzin mojego bloga. Przeglądałem tylko kilka stron spośród wszystkich ponad 32 tysięcy słów kluczowych i wybrałem tylko kilka, by je skomentować. Postanowiłem je podzielić na kilka kategorii, w zależności od tematyki zapytania.
Microsoft
- Windows do ściągnięcia - było wiele kombinacji tego zapytania, np. Windows torrent, Windows XP do ściągnięcia, Windows Vista do ściągnięcia, etc. Moja odpowiedź - nie da się. To nie Ubuntu. Ani nawet Debian. Odpowiedź dla zaawansowanych: MSDN. Z drugiej strony, ciekawi mnie czy Ci, którzy szukali Windowsa do ściągnięcia naprawdę spodziewali się linka do obrazu ISO?
- klucz aktywacyjny do windowsa - tutaj też miałem kilka odmian tego zapytania o cracki, klucze, seriale i temu podobne. To fajnie, że ludzie szukają kluczy na stronach gościa, który pracuje w Microsoft. Bo ostatecznie to chyba dobrze, że tu, a nie gdzie indziej. To szczególnie przydatna informacja, że tego typu zapytania wciąż krążą po Internecie. Oznacza to, że program o nazwie "Anti-Piracy", którego jestem częścią, ma sens. Następnym razem, po prostu dajcie znać, że macie pirata.
Widziałem jeszcze kilka innych ciekawych dot. produktów Microsoft. Niektóre bardziej, inne mniej śmieszne, ale te dwa wspomniane wyżej zapytania wciąż stanowią największą część słów kluczowych na podstawie których ludzie do mnie trafiają.
Pochodne od IT
- jak działa Google - całkiem dobre wyjaśnienie znajduje się na Wikipedii pod hasłem "Google search". Niestety nie ma wersji polskiej tego tekstu.
- poszukuję programisty - jeśli tu trafiłeś przez to zapytanie, to źle trafiłeś. Kiedyś szukałem, teraz już nie.
- informatyk wracam do polski z irlandii - czyżby ktoś z polskiego projektu "Powroty" szukał blogerów wśród informatyków szykujących się do powrotu? Zapraszam na stronę forum Polish IT Club, gdzie można poczytać o dyskusjach Polaków pracujących w IT w Irlandii. Kilka wątków o powrotach już się pojawiło.
Totalnie zakręcone
- panie na gg - wróżę krótkie życie agencji matrymonialnych czy ogłoszeń w prasie. Najnowszy przebój to panie na gg!
- jak zostać sławnym/sławną - otwórz bloga, napisz coś i czekaj aż dziwne zapytania będą lądować w Twoich statystykach odwiedzin
- palące dzieci - napisałem kiedyś o cenzurze we Flickr dot. zdjęcia dziecka z papierosem w ustach. Ale mój blog nie jest miejscem do poruszania jakiejkolwiek tematyki związaenej z problemem młodocianych palaczy.
- dlaczego jestem tak naiwny/naiwna? - naprawdę szukasz odpowiedzi na to pytanie? Naprawdę uwierzysz w to, co przeczytasz? To zapraszam tutaj.
- dowal komuś, dowalić komuś, jak dowalić komuś - zadziwiające, że "dowal komus" na Google daje mój blog na pierwszej pozycji wyszukiwania. Live.com już nie popełnia tego błędu.
- dlaczego jestem w jakim celu na świecie - odpowiedzi na to pytanie zazwyczaj poznajesz kiedy jest już za późno by ten cel zrealizować
- dziecko z butelka alkoholu- zdjecia - pochodne do zapytania z papierosem
- księżniczka diana z rodu williams foto galeria - to nawiązanie do mojego posta z października 2007 roku. Ktoś pewnie dostał przypadek podobnego spamu jak ja.
- bedę dobrym sprzedawcą w przyszłości? - nie mam pojęcia. Ale jeśli spodziewasz się znaleźć odpowiedź na to pytanie w Internecie, to jestem przekonany, że nie.
Google, Live czy inne wyszukiwarki zindeksowały każde słowo z mojego bloga. Dlatego nie dziwi mnie, że adres http://michal.osmenda.com pojawia się na liście wyszukiwań, kiedy poszukiwana jest "księżniczka Diana z rodu Williams". Dziwi mnie jednak, że wchodzą na moją stronę nawet wtedy, kiedy każdy jeden tytuł strony na moim blogu zaczyna się od "ITblog". IT nie brzmi jak Pudelek czy Onet. IT brzmi całkiem podobnie do information technology, co może oznaczać tematy pochodne do technologii komputerowych.
Czyżby było to wyzwanie dla algorytmów wyszukiwania, by nie umieszczać wysoko na liście stron, które wymieniają wyszukiwaną frazę raz, może dwa razy, ale tematyka jest zupełnie nie przystająca do wyszukiwanych słów?
W jaki sposób możemy zapobiec, by blog taki jak ten był na szczycie wyników wyszukiwania dla frazy "księżniczka diana z rodu williams" pomimo, że moja strona zawiera dokładnie taką frazę, ale tylko raz? A najważniejsze, czy można taką optymalizację zautomatyzować, by zbudować chociaż pozory sztucznej inteligencji odróżniającej główną tematykę (spam, o czym był tekst) od szumu tła (księżniczka, gdzie słowo to wystąpiło dwa razy)?
Podobne wpisy:

Jestem pewien, że po tym wpisie będziesz miał więcej wejść przez frazę “księżniczka diana z rodu williams” xD
No ale przecież Windowsa można ściągnąć z sieci. Podaję linka: http://tinyurl.com/946f4q . No co, nikt nie mówił, że ma być za darmo
Z „dowal komuś” to Google chyba robi to co trzeba, w końcu, bo o czym niby jest ten post?
Wyszukiwanie kontekstowe byłoby ciekawe. Ale zaraz, czy już przypadkiem ktoś tego nie próbował? Był sobie swego czasu Ask Jeeves (dzisiaj ask.com) który działał dosyć fajnie IMO, choć tylko po angielsku. Obił mi się też o oczy projekt Mozilli dotyczący nowych sposobów interakcji z przeglądarką i internetem. Ciekawe czy kiedyś naprawdę porozmawiamy z komputerami w swoim domu