Jeżeli wyszukiwarka dowiedzieć się, jak do rangi stronę oglądając wyszukiwarki używać innych wyszukiwarek?
Czy informacje uzyskane od dostawców usług internetowych (ISP) i serwery proxy sieci być wykorzystane do budowy niemal w czasie rzeczywistym mapę sieci, które krotnie informacje o tym ruchu w system rankingowy dla tych stron?
Nowy wniosek patentowy z Pisa opartej zespołu badawczego w Ask.com bada te tematy i kilka innych, i proponuje sposoby poprawy świeżość, zasięg, ranking i grupowanie wyników wyszukiwania poprzez patrząc na danych internetowych użytkowników ruchu.
Dlaczego Obejrzyj informacji o ruchu w sieci Web?
Istnieją trzy podstawowe zadania, które wyszukiwarka będzie normalnie wykonywać. Będzie:
- Czołgać w internecie, aby znaleźć ważne strony
- Przechowuj ważne słowa (słowa kluczowe) stosowane w tych stronach, i gdzie te słowa znajdują się na stronie.
- Ranking stron z jakiegoś rankingu algorytm, oparty w części na znaczenie dla danego użytkownika wyszukiwarki zapytania, przy przygotowywaniu listy wyników wyszukiwania.
- Starsze strony mogą być preferowane, ponieważ są zazwyczaj bardziej linki kierujące do starszej stronie niż tam są linki kierujące do starszej stronie.
- Wysoko w rankingu stron będzie wydają się być powiązane przez więcej użytkowników, co zwiększy ich ranking - bogate coraz bogatsze - a słabo w rankingu stron nie przyciągnie jak najwięcej linków.
- Gdy ktoś jedzie do strony bez użycia hiperłączy (na przykład przez wprowadzenie bezpośrednio do URL przeglądarki), która nie jest częścią działania jak szeregach wyszukiwania stron jest.
Pobieranie próbek ruchu użytkowników Internetu do poprawy Wyniki wyszukiwania
wynalazku: Antonino Gulli, Antonio Savona, Monica Mori
US Patent Application 20070112730
Opublikowano 17 maja 2007
Filed: 07 listopada 2005
Streszczenie
Metody, systemy i urządzenia do poprawy wyników wyszukiwania internetowe obejmują monitorowanie aktywności sieciowej w sieci komunikacyjnej, tworząc niemal w czasie rzeczywistym mapę aktywności sieci, a także integrację niemal w czasie rzeczywistym mapę z wyszukiwarki.Cele, które w tym procesie mają na celu poprawę świeżości, pokrycia zasięgiem, ranking i grupowanie wyników wyszukiwania poprzez:
- Monitorowanie aktywności w sieci,
- Generowanie niemal w czasie rzeczywistym mapę aktywności internetowej, oraz;
- Integracja informacji z niemal w czasie rzeczywistym mapie działalności internetowej z rankingu, że wyszukiwarka tworzy.
Wiele ranking algorytmy stron internetowych wiąże patrząc na stronie, jak gdyby był duży wykres, z innych stron lub katalog stron rodzaju dokumentów, że można podróżować do zwane "węzły", a połączenia między tymi węzłami (zazwyczaj linki z jednej strony na drugą ) w "krawędzi." informacje o węzłach i o krawędzi mogą być wykorzystane do pozycjonowanie stron.
Niemal w czasie rzeczywistym mapę opisane w tym dokumencie będzie również wykres internetowa oparta na monitorowanego ruchu w sieci. To może być skierowany wykres , który obejmuje węzły sieci reprezentujących stron internetowych i krawędzi sieci stanowiących ważonych powiązań pomiędzy węzłami.
Związki mogą stanowić:
- Hiperłącza między stronami, i / lub;
- Użytkownik nawigacji pomiędzy bez hiperłączy.
Czasami nie ma hiperłącza pomiędzy stronami, ale wirtualne krawędzie mogą być tworzone między tymi dwoma węzłami niepołączonych gdy wielu użytkowników nawigacji pomiędzy węzłami.
Informacje zbudować ten niemal w czasie rzeczywistym wykres aktywności internetowej mogą być zbierane od dostawców usług internetowych oraz serwerów proxy sieci Web .
Wyszukiwarka może wykorzystać sieci danych o ruchu uzyskane przez monitora ISP ruchu na budowę i utrzymanie niemal w czasie rzeczywistym mapę aktywności sieciowej wielu użytkowników w sieci.
Wykres internetowej mogą zawierać setki, tysiące, a nawet wielu miliardów węzłów internetowych i krawędzi sieci, w zależności od zakresu serwerów internetowych i / lub dostawców usług internetowych w sieci komunikacyjnej.
Każdy web krawędź E.sub.i, j mogą być związane z masy W.sub.i, j reprezentujący wagę i / lub świeżości krawędzi internetowej.Przykłady:
Za każdym razem ktoś przechodzi z jednej strony internetowej do drugiej, że ruch może być rejestrowany przez monitor ruchu w sieci, a waga krawędzi sieci między tymi dwoma węzłami może zostać zwiększona.
Jeżeli powstała krawędzi zwoju nie jest się w określonym okresie czasu, waga krawędzi zwoju może być zmniejszony.
Tak, ten wykres Web działalności ruchu użytkownik może dynamicznie śledzić połączenia między stron internetowych, jak ewoluują. Można tworzyć nowych krawędzi między węzłami sieci Web, ponieważ są łatwo i usunąć krawędzie sieci między węzłami sieci Web po użycia przez wystarczający okres czasu.
Nowych węzłów WWW można również dodać do wykresu WWW są one utworzone, i usuwane z wykresu WWW, jeśli nie są dostępne.
Integracja ruchu użytkownika z wyszukiwarki
Gąsienicowy Web wyszukiwarkę będzie indeksować strony zidentyfikowane na wykresie i zakotwiczenia sieci WWW w każdej krawędzi części tekstu otaczających łącze na stronie łączenia drugiej strony na drugim końcu krawędzi zwoju. Tak więc, kiedy zapytanie z wyszukiwarki wywołuje pewną część anchor text, wyszukiwarka może oceniającym wyniki wyszukiwania na podstawie wag krawędzi w grafie internetowych WWW, które są zakotwiczone za pomocą słów w zapytaniu.
Usuwanie stronniczość w wynikach wyszukiwania
Kiedy strona jest podłączone do jednego lub więcej innych stron WWW przez krawędzie, które mogą być przydzielone do strony masy (znaczenie) na podstawie wag krawędzi, że strona jest połączona.
Może być stosowany do wszystkich stron w wykresie internetowej. Waga stronie internetowej mogą być obliczane od wag krawędzi, które łączą się na stronie internetowej, jak również wagi stron internetowych, które łączą się z innymi końców krawędzi.
Te obliczone wagi stron może być używany do generowania wynik znaczenie dla rankingu stron internetowych w wyszukiwarkach.
Obliczona masa stronie mogą być wykorzystywane, aby dodać stronę do indeksu wyszukiwarek, jeśli wyliczona waga przekracza określoną wartość progową i może być używany do usunąć stronę z indeksu, jeśli spadnie poniżej określonego progu.
Świeżość
Monitorować ruch internetowy może być używany razem z wykresem internetowej wyeliminować martwe stron z wyników wyszukiwania.
Kiedy ktoś próbuje odwiedzić stronę, a oni się błąd w odpowiedzi, że strona nie zostanie znaleziona, monitor ruchu ISP będzie zobaczyć tę odpowiedź, a wykres WWW może być modyfikowany w celu wyeliminowania krawędzi internetowych, które zostały podłączone do martwa strona internetowa w istniejącym wykresie internetowej. Tak złe wyniki wyszukiwania mogą być usuwane z indeksu bez czekania na robota internetowej odkryć martwy stronę.
Poprawa wyników wyszukiwania
To było ciekawe podejście, że zaskoczył mnie trochę. Wyniki wyszukiwania z innych wyszukiwarek może być analizowany w celu poprawy wyników wyszukiwania w wyszukiwarce, który mierzy i śledzi dane internetowych użytkowników ruchu.
Wyszukiwarka może być sprawdzony przez wyszukiwarki. Że użytkownik może wybrać wyników wyszukiwania i przejdź do wybranej strony WWW. Wszystkie aktywności użytkownika (np. w tym zapytaniu i odbiornika) można zalogować się w dzienniku operacji i wykorzystywane do aktualizowania wykres internetowej. Na przykład, zapytanie i wybrany obiekt z pierwszej wyszukiwarki mogą być powiązane ze sobą w drugiej wyszukiwarki.
Wyniki klastrowania
Wykres internetowa może być wykorzystywana w celu poprawy grupowania obiektów sieci i / lub kwerend (np. stowarzyszenia różnych kwerend o wspólnym strony).
Przykład:
Ktoś wyszukiwania w wyszukiwarce za pomocą Query "Madonna", i wybiera stronę www.rockstars.com. Kolejny poszukiwacz składa zapytania "Britney Spears" w innej wyszukiwarce, i wybiera www.rockstars.com. Następnie dziennik aktywności ISP odzwierciedlają zarówno pytania i wybory nawigacyjnych, a te dwa różne pytania mogą być zgrupowane w indeksie wyszukiwarki, a stają się związane z www.rockstars.com.
Burstiness
Świeżość wyników wyszukiwania można poprawić poprzez monitorowanie i analizowanie wybuchy ruchu internetowego (np. liczne odwiedziny na jednostkę czasu).
Ważne (np. popularny) zestaw stron internetowych mogą być łączone (związane) poprzez monitorowanie i analizowanie wybuchy ruchu internetowego w kierunku zestawu stron internetowych, które mogą rozkładowi po okresie czasu.
Przykład:
Zbiór stron internetowych i zapytań związanych z klęską żywiołową, takich jak trzęsienia ziemi, Coulds być łączone i mocno ważone bezpośrednio po klęski żywiołowej, ale wagi może zmniejszyć szybko jak zainteresowanie i aktywność internetowa ubywa.
Że grupowanie może być utrzymywana tylko tak długo, jak w sieci działań (np., do tematu zapytania na jednostkę czasu) utrzymuje się powyżej określonej wartości progowej.
Personalizacja
Wyniki wyszukiwania dla danego użytkownika mogą być personalizowane poprzez monitorowanie i analizowanie ruchu w sieci. Grupy użytkowników może być określone na podstawie podobieństwa ich aktywności w sieci w okresie monitorowania.
Ich działania mogą być śledzone:
- położenie geograficzne,
- przez liczbę podobnych stron internetowych, odwiedzanych w okresie monitorowania,
- przez liczbę podobnych kwerend złożonych w okresie monitorowania, lub;
- każdy inny parametr, który może być dostępny z danych ruchu w sieci.
Danych o ruchu z sieci może być związane z definiowanym grupy użytkowników i oddzielny wykres internetowa może zostać wygenerowany dla tej grupy użytkowników. Działalność poszczególnych użytkowników mogą być śledzone, na przykład, przez użytkownika IP (Internet Protocol) i / lub korzystanie z plików cookie.
- Wykres Web mogą być generowane, że wiąże się z określonej grupy użytkowników.
- Następnie, nowy użytkownik może być zidentyfikowany, że aktywność internetowa wystawy, która jest podobna do jednej z określonych grup użytkowników (np. położenie geograficzne, nawigacja, pytania, etc.)
- Wyniki wyszukiwania przewidziane dla nowego użytkownika mogą być następnie uprzedzony przez wykres internetowej reprezentującego aktywność internetowej powiązanej grupy użytkowników za czas związany z okresu monitorowania grupy użytkowników.
W zgłoszeniu patentowym, trudno jest stwierdzić, czy określone procesy opisane w tym dokumencie kiedykolwiek zostanie uwzględniona jak wyszukiwarka może pozycjonowanie stron w internecie. Ale jest to doskonałe wprowadzenie do niektórych potencjalnych zastosowań aktywności ruchu w sieci Web oraz sposób zastosowania te mogą wpływać rankingach.
Dokument ten ogranicza się do informacji uzyskanych od Służby Internet zapewnia, i nie mówić o danych, które mogą być zbierane od źródeł, takich jak paski narzędzi lub innego pomocnika dodatki przeglądarki.
Trudno nie myśleć o innych wyszukiwarek, a niektóre z rzeczy, które robią, że może korzystać z niektórych procesów, takich jak te opisane tutaj. Na przykład, informacje zbierane przez Historii online Google.