- cross-posted to:
- charity
- cross-posted to:
- charity
Zrzutka obecnie wskazuje, że zebraliśmy 331 złotych, i tak już jest od dłuższego czasu. Wolne miejsce na serwerze zbliża się ku końcowi. Dlatego, jeżeli chcesz pomóc w budowaniu polskiego projektu wyszukiwarki - wpłać i/lub udostępnij, nawet na korpomediach.
Czy chcecie zastąpić Duck Duck Go?
Ta wyszukiwarka jest bardzo ciemiezna (że tak to ujmę), przez co wiele osób szybko z niej rezygnuje. Czy Wasza będzie (jest?)… lepsza?
My nie budujemy kolejnego frontendu Binga. Ogolnie rzecz biorac, wiele ludzi szybko rezygnuje z Binga i jego pochodnych, w tym DuckDuckGo. Zamiast tego, skupiamy sie na wlasnym indeksie, a tych ktorzy chca cos wiecej, moga na wlasne zyczenie wlaczyc wyniki z Google (domyślnie jest to wyłączone).
Jeżeli zostać już przy przykładzie DDG, w porównaniu do nich posiadamy [a] własny indeks składający się w chwili publikacji komentarza z ~14.4 milionów dokumentów, co daje nam około 30 GB wielkości, [b] raporty potencjalnych skryptów śledzących w wynikach do włączenia w ustawieniach w oparciu o nasze własne dane, [c] bezpośrednie linki do Internet Archive lub innej wybranej usługi archiwizacyjnej (o ile administrator instancji zdefiniował listę) z poziomu strony wyników wyszukwiania, [d] nie mamy reklam w wynikach, model biznesowy oparty jest na crowdfundingu, [e] wkrótce każdy będzie mógł uruchomić własną wyszukiwarkę w oparciu o nasze oprogramowanie, indeksując to, co leży na sercu administratora instancji, za pomocą crawlera, który jest w trakcie przepisywania na inny język, [f] możesz blokować i podbijać strony w wynikach z poziomu ustawień, dzięki czemu nie musisz instalować dodatkowych wtyczek w przeglądarce, [g] jesteśmy dostępni na ten moment w 4 językach (AmE, BrE, polski i węgierski), ale chętnie przyjmiemy tłumaczenia na więcej. Wiem tyle, że esperanto i chyba niemiecki jest w trakcie tworzenia.
Chyba nie muszę tłumaczyć, jak bardzo to bije “prywatne” DuckDuckGo na głowę. Oni są tylko frontendem do Binga na sterydach, a ich system reklamowy pochodzi od równie “prywatnego” Microsoftu.
Nie musisz tłumaczyc, bo - czytając Twoje dotychczasowe wpisy - i tak nic nie zrozumiem (jak z tego wpisu). Zdecydowana mniejszość użytkowników internetu (w tym ja) zna specjalistyczny język którym posługują się programiści i im podobni.
Jak można zacząć używać Waszej wyszukiwarki?
https://staging.peekr.org
Dzięki.
Wpisałem “Antyrewolucja pazdziernikowa” (myśląc o artykule sprzed 15 lat autorstwa Macieja Drabinskiego, opublikowanym na jego blogu, a później na innych stronach www). Nie znalazło nic.
Wpisałem “Wolna Biblioteka Wroclaw” (mając na myśli oddolną bibliotekę, prowadzoną przez zapaloną ekipę od 8 lat. Wolna Biblioteka ma swoją stronę www i konta na różnych portalach). Znalazło mi pięć wyników: A) Osiek, B) Wrocławianin, C) Ratusz w Kłodzku, D) Wyższa Szkoła w Brzegu, E) Bernard Janusz Albin.
Dzięki za sugestie. Mógłbyś podać linki do stron które Cię interesują, żebym mógł dodać je do indeksu?
Drabina.wordpress.com
Wolnabiblioteka.pl
Czy wszystkie strony, które zawierają treści wyszukiwane przez użytkowników, musicie ręcznie dodawać do indeksu? Jeśli tak, to nie brzmi to obiecująco.
Nowy crawler, o którym wspominałem w innym komentarzu (nie pod tym tematem), sam przeszukiwał strony, ale tak jak mówiłem - wydajnościowo nie był jakiś super. Według mnie i tak by było lepiej, żeby indeks był budowany ręcznie (przynajmniej na tę chwilę), niż żeby nie było go w ogóle, a wyniki wtedy by były zaciągane z Google’a czy Binga. I tak docelowo mamy w planach automatyzację budowania bazy przeszukiwalnych stron. (Zaznaczę, że działamy pro publico bono, i trochę może nam to zająć ze względu na to, że nie budujemy wyszukiwarki na pełen etat, no i mamy też inne rzeczy na głowie.)
Co do tego 1. linku, zdążyłem już go znaleźć i jest on już dostępny w wynikach. Drugiej strony nie mogłem zakolejkować ze względu na błąd techniczny niezależny ode mnie.