English version

Marcin Sochacki (Wanted) Blog, Internet, Technologia

» Niektóre wiadomości z Onetu wyparowują

Wygląda na to, że albo Onet ma problemy ze swoją bazą danych, albo niektóre wiadomości z innych dziwnych powodów po prostu znikają z archiwum. Na problem natknąłem się w artykule z Wikipedii na temat Lecha Wałęsy, gdzie oba linki prowadzące do serwisu wiadomosci.onet.pl przestały działać. Onet wyświetla tylko tekst „Przepraszamy, ale takiej strony tu nie ma.”

Z punktu widzenia redaktora Wikipedii, poprawne uźródłowienie artykułu jest jednym z podstawowych kryteriów jego jakości. W przypadku źródeł internetowych kluczowym zagadnieniem jest stałość URL-i. Już w 1998 roku Tim Berners-Lee, twórca WWW, napisał świetny artykuł pt. „Cool URIs don't change” („Fajne URI się nie zmieniają”). Niestety redaktorzy wielu serwisów newsowych, w tym Onetu, mają tę zasadę w głębokim poważaniu. Często zmieniany jest schemat URL-i czy kasowane są archiwalne artykuły. Przykładowo: link do wiadomości z 21.09.2007, to samo w Google Cache. Więcej przykładów można znaleźć wpisując w wyszukiwarce Google takie wyrażenie: [site:wiadomosci.onet.pl inurl:item] albo sprawdzając bezpośrednio w wikipediowej wyszukiwarce.

W tej sytuacji wypadałoby przejrzeć inne artykuły w Wikipedii i poszukać innych martwych linków do Onetu. W większości wypadków można je łatwo zastąpić linkami do innych serwisów, niemniej jest to praca syzyfowa – do czasu kolejnej reorganizacji.

Piętno dla Onetu za dziury w bazie danych.

Aktualizacja: po zasygnalizowaniu problemu na liście dyskusyjnej wikipedystów wojtekk wysunął hipotezę, że problem martwych linków dotyczy tylko artykułów pochodzących z PAP-u. Umowa licencyjna podpisywana z niektórymi wydawcami ogranicza czas prezentowania archiwalnych artykułów do 30 dni. Wygląda na to, że faktycznie artykuły PAP-owskie znikają z bazy Onetu po 30 dniach. W związku z tym należałoby moim zdaniem wyświetlać bardziej opisowy komunikat niż „takiej strony nie ma”. Dla wikipedystów oznacza to konieczność bacznego sprawdzania źródeł i unikania onetowych artykułów pochodzących z PAP-u.

2007/10/25 23:09 | komputery/wikipedia/

» Komentarze

To nie do końca tak. W przypadku niektórych agencji prasowych, ich informacje muszą być wyłączane po określonym czasie. Możliwe, że taka sytuacja miała miejsce - nie wynika to ze złej woli portalu...

wojtekk | 2007/10/26 09:38


A nie można botem podmienić linków na cache googla?

xxx | 2007/10/26 11:39


@xxx:
Nie, bo cache Google też nie przechowuje kopii na zawsze. Trzeba podmienić po prostu na bardziej stabilne źródło.

Wanted | 2007/10/26 17:55


"Niestety redaktorzy wielu serwisów newsowych, w tym Onetu, mają tę zasadę w głębokim poważaniu." -- dokładnie w identyczny sposób to się tyczy Wikipedii!!! Zapomniałeś o tym? Wikipedia też nie jest w żadnej mierze "stabilnym źródłem". W dowolnym momencie dowolny artykuł (wraz z historią, a więc też wszystkimi "stałymi" wersjami) możne zniknąć z publicznych oczu (na skutek procedury SDU lub widzi-mi-się dowolnego admina; obie procedury są na dobrą sprawę kompletnie losowe); co więcej, dowolny artykuł może się dowolnie zmienić w dowolnym stopniu w dowolnej chwili.
Tak, wiem o tym, że można linkować do "stałej" wersji, ale niewiele osób podających linki do WP tak robi, niestety. Sama WP odstrasza od tego, strasząc tekstem na czerwonym tle na górze strony (jakiś tekst ostrzeżenia powinien być też na każdej stronie artykułu w WP, także tej najnowszej - pomyśl o tym, w końcu "stara" wersja była przez pewien czas aktualną, prawda?).

WikiKrytyk | 2007/10/28 03:27


@WikiKrytyk:
Oj coś ketrab Ci forma spada ostatnio. Wcześniej jeszcze trzymałeś jakiś poziom merytoryczny zarzutów, a tutaj taka żenada.

Po kolei:
1) Wikipedia nie jest źródłem i nie zamierza być. Jeśli ktoś cytuje Wikipedię jako źródło, zwłaszcza jedyne, to robi poważny błąd (to samo zresztą przy cytowaniu innych encyklopedii). Wolne źródła są gromadzone np. w projekcie Wikisources.

2) SDU dotyczy artykułów o słabej wartości merytorycznej lub nieencyklopedycznych. Nie spodziewam się wyrzucenia na SDU czy przez admina np. artykułu [[Lech Wałęsa]]. No i nie wiem po czym wnosisz losowość procedury SDU.

3) "dowolny artykuł może się dowolnie zmienić w dowolnym stopniu w dowolnej chwili"
Wow, teraz dopiero to odkryłeś? Tak działa mechanizm wiki.

4) "Sama WP odstrasza od tego, strasząc tekstem na czerwonym tle na górze strony"
Dla Ciebie odstrasza, dla mnie informuje. Punkt widzenia zależy od punktu siedzenia.

5) Co do ostrzeżenia o ew. błędach, to częściowo się zgadzam. Link do opisu, który obecnie znajduje się na dole w "Informacje prawne" być może powinien być bardziej widoczny, na górze strony.

Wanted | 2007/10/28 15:20










Mój blog

Działy

/ (82)
  info/ (5)
  komputery/ (51)
    apple/ (1)
    google/ (15)
    inne/ (4)
    linux/ (3)
    microsoft/ (10)
    spam/ (1)
    wikipedia/ (6)
    www/ (11)
  media/ (5)
    reklama/ (5)
  miejsca/ (5)
    aconcagua/ (1)
    dublin/ (2)
    trojmiasto/ (2)
  to_lubie/ (16)
    film/ (6)
    foto/ (3)
    humor/ (1)
    sport/ (6)

Archiwa


Odnośniki


Strefa bez kolorów

Ta strona jest zgodna z zasadami Łeb 2.0™!