Biblioteka Narodowa używa na swojej stronie plików cookies. Brak zmiany ustawień przeglądarki oznacza zgodę na ich użycie. [zamknij]

I wespół w zespół, wespół w zespół: kategoryzowanie społecznościowe w praktyce

Dodał: Kacper Trzaska,

Technologia produkcji | 3 komentarze

Muffet, paper-texture, www.flickr.com

Muffet, paper-texture, www.flickr.com (CC BY 2.0)

Kategoryzowanie społecznościowe a biblioteka

Obszarem działalności bibliotekarskiej, w który można włączyć czytelników, jest tagowanie, kategoryzowanie i komentowanie książek dostępnych w bibliotece. Charakterystyka informacyjno-wyszukiwawcza książki czasami nie oddaje w pełni wszystkich zawartych w niej treści. Społeczne kategoryzowanie, tworzenie słów kluczowych przez użytkowników serwisu a nie przez wykwalifikowany personel, mogłoby wpłynąć na zwiększenie efektywności wyszukiwania informacji w bibliotece. Miałoby funkcjonować obok języków informacyjno-wyszukiwawczych, ale nie zamiast nich. Czytelnik za pomocą specjalnego formularza dostępnego on-line, wpisywałby słowa kluczowe, które składałyby się na opis rzeczowy. Oczywiście wszystkie tagi nadawane przez użytkowników przechowywane byłyby w osobnej bazie i nie mieszałyby się z opisami rzeczowymi dokonywanymi przez bibliotekarzy. Społeczne tagi to cenna informacja dla bibliotekarzy, ponieważ w ten sposób możemy dowiedzieć się, jakich informacji poszukują czytelnicy, a najbardziej popularne tagi można włączyć do słownika języka, z którego korzystamy przy opracowaniu rzeczowym.

Nadmiar informacji

Rodzi się obawa przed nadmiarem informacji i szumem informacyjnym, które powstałyby w efekcie takiej działalności. Należy jednak zaznaczyć, że nadawanie kategorii przez czytelników nie byłoby pozostawione bez kontroli bibliotekarzy. Ciekawą propozycją jest stworzenie rozbudowanej sieci odsyłaczy, które konstruowaliby sami czytelnicy. Mogłoby to zapobiec mnożeniu podobnych słów kluczowych, ale nie wpłynęłoby na efekty wyszukiwania. Umożliwienie czytelnikom takiej opcji powoduje integrację wszystkich użytkowników biblioteki. Komentarze do książek to konkretna podpowiedź i rada dla innych, którzy być może przy wyborze pozycji do czytania będą się sugerować taką oceną. Oprócz systemu komentarzy, biblioteka mogłaby zaoferować ocenianie książek i tworzenie rankingów pozycji, które otrzymały najwyższe noty. Informacja o najbardziej popularnych pozycjach to wskazówka dla bibliotekarzy, o tym jakie książki należy gromadzić. Już teraz w serwisach niektórych bibliotek, stworzono możliwość zaproponowania zakupu konkretnej książki. Czytelnicy za pomocą elektronicznego formularza, bądź pisząc na forum dyskusyjnym proponują uwzględnienie w zakupie interesującej ich pozycji. Elektroniczny zeszyt dezyderat to również cenne  źródło informacji o bieżącym zapotrzebowaniu na pozycje z danego segmentu rynku wydawniczego.

Istotną kwestią jest konieczność rejestracji i każdorazowego logowania, przed dokonywaniem jakichkolwiek operacji. Taki wymóg decyduje o tym, że można ograniczyć powstawanie informacji nieprawdziwych czy nawet niezgodnych z prawem. Cały proces włączania czytelników w działania biblioteki odbywałby się pod nadzorem bibliotekarza, który podpowiadałby jak poruszać się po wirtualnej rzeczywistości. 

Folksonomia w badaniach

Badaniem zostały objęte trzy spośród najpopularniejszych serwisów społecznościowych: Delicious, Furl i Technorati. Są to portale umożliwiające gromadzenie ulubionych i najbardziej przydatnych linków do stron internetowych, bądź blogów prowadzonych w sieci. Oprócz możliwości  przechowywania odsyłaczy do konkretnych miejsc w sieci, zasadniczą funkcją badanych serwisów jest możliwość grupowania informacji za pomocą oznaczania ich etykietami przybierającymi postać jednowyrazowych tagów. Autorka skupiła się na możliwości wzrostu efektywności wyszukiwania informacji przy wykorzystaniu kategorii generowanych przez użytkowników. Analiza trzech serwisów trwała trzydzieści dni, polegała na codziennym zbieraniu danych pod postacią najbardziej popularnych tagów wygenerowanych danego dnia. Następnie wszystkie dane ilościowe zostały zebrane i przygotowane do badań jakościowych. Skalę porównawczą, w ocenie jakości produkowanych etykiet, stanowiły wytyczne międzynarodowego konsorcjum NISO (National Information Standards Organization) w sprawie poprawnej budowy tezaurusów. Autorka zaznacza, że ocenę nowoczesnych metod organizacji informacji można realizować wyłącznie zestawiając ją z dotychczas obowiązującymi zasadami funkcjonowania języków informacyjno-wyszukiwawczych o kontrolowanej budowie słownictwa. Stosując taką komparatystyczną metodę badań można stwierdzić w jakim stopniu kategoryzowanie społecznościowe odzwierciedla normy powszechnie akceptowane w tradycyjnych systemach taksonomicznych.

Przy konstruowaniu nowych jednostek leksykalnych jiw należy zminimalizować zjawisko homografii, które w znacznym stopniu utrudnia wyszukiwanie informacji.

Występowanie homografów w badanych serwisach przedstawia się następująco:

  • Delicious 3%
  • Furl 2%
  • Technorati 1%

Zaleca się, aby generowane oznaczenia miały postać jednowyrazowych rzeczowników, użycie innych form gramatycznych (przymiotników bądź przysłówków) należy zminimalizować. Należy pamiętać aby forma oznaczeń była możliwie klarowna i jednoznaczna, dzięki czemu możemy mieć pewność, że odbiorca wiadomości bez trudności będzie mógł odnaleźć nasze informacje.

Forma gramatyczna generowanych tagów przedstawia się następująco:

Jednowyrazowe tagi

  • Delicious 93%
  • Furl 76%
  • Technorati 80%

Rzeczowniki

  • Delicious 88%
  • Furl 71%
  • Technorati 86%

Struktura gramatyczna tagów odzwierciedla zalecenia poprawnej budowy języków informacyjno-wyszukiwawczych. Spośród wszystkich nadanych etykiet większość stanowiły pojedyncze wyrazy będące rzeczownikami.  Liczba użytych przymiotników była bardzo mała i stanowiła łącznie ok. 5% wszystkich tagów, przysłówki nie były stosowane.

Nowogenerowane kategorie powinny być zgodne z obowiązującymi zasadami ortografii, których wykładnia są obowiązujące słowniki i leksykony. Pomimo obaw przeciwników wykorzystywania wiedzy rozproszonej w Internecie, większość informacji stworzonych przez użytkowników ma poprawną formę.

Występowanie błędów ortograficznych w generowanych tagach przedstawia się następująco:

  • Delicious 4%
  • Furl 3%
  • Technorati 2%

Pamiętając o konieczności konstruowania możliwe przejrzystego i zrozumiałego komunikatu, należy unikać stosowania skrótów i akronimów. Dopuszcza się taką formę wyłącznie gdy jest przyjęta i ugruntowana w danej społeczności. Jako że kategoryzowanie społecznościowe realizowane jest przez grupę osób skupionych wokół wspólnych zainteresowań i potrzeb informacyjnych, dosyć często spotyka się użycie skrótów i akronimów. Przy braku jakiejkolwiek formy odsyłacza czy wyjaśniania, znacznie ogranicza się grupa potencjalnych odbiorców zakodowanej informacji.

Użycie skrótów, akronimów i neologizmów w generowanych tagach przedstawia się następująco:

Skróty i akronimy

  • Delicious 22%
  • Furl 16%
  • Technorati 19%

Neologizmy

  • Delicious 3%
  • Furl 10%
  • Technorati 6%

Zazwyczaj wyrażenia slangowe, żargon środowiskowy bądź neologizmy nie są uwzględniane w słownikach, dlatego też należy założyć, że wyrażenia tego typu nie będą znane wszystkim użytkownikom serwisu. Stąd zaleca się zminimalizowanie stopnia użycia wyrazów tego typu. Jeżeli nie ma stosowanych alternatywnych form, wtedy użycie neologizmów jest uzasadnione.

Badane serwisy społecznościowe, wraz z ich systemami kategoryzowania, w pewnym stopniu odzwierciedlają zalecenia budowy poprawnego języka informacyjno-wyszukiwawczego. Tagi mają w  miarę spójna formę gramatyczną, są poprawne pod względem ortografii. Jednakże to nie zapewnia efektywnego wyszukiwania informacji. Największy problem stanowią: wieloznaczność, homografia, skróty, neologizmy i brak spójności w używaniu formy pojedynczej i mnogiej rzeczowników. Cały materiał badawczy w około jednej czwartej stanowiły takie wadliwe tagi. Osobnym zagadnieniem jest stosowanie fraz (ang. miltiterm tags), mających postać wyrażeń, z rozpoznaniem których nie może sobie poradzić system wyszukiwawczy. Użytkownicy starają się rozwiązywać ten problem doraźnie, poprzez wstawianie różnych znaków interpunkcyjnych oddzielających dwa wyrazy. Jest to rozwiązanie krótkoterminowe, przy ciągle rozrastających się zasobach, nie mające większego zastosowania.

Możliwe korzyści

Kategoryzowanie społecznościowe może służyć jako dobra metoda organizacji, dzięki czemu mogłaby wzrosnąć efektywność całego procesu wyszukiwania (poprzez zwiększenie kanałów dostępu do każdej z informacji). Konieczne byłoby wprowadzenie kontroli generowanych treści, systemu podpowiedzi oraz rozbudowanej sieci relacji pomiędzy poszczególnymi kategoriami tworzonymi przez czytelników.

  • Facebook
  • Wykop
  • Delicious
  • Twitter
  • Gwar
  • Email

3 komentarzy

  1. Niedoszły Bibliotekarz 21-10-2011 07:38

    Poprosiłbym o jakieś namiary na przytaczane badania. Choćby podstawowe minimum kto je przeprowadził i kiedy.

  2. Kacper Trzaska 21-10-2011 10:59

    Badania struktury tagów w trzech popularnych serwisach społecznościowych zostały przeprowadzone przez Louise F. Spiteri (Dalhousie University)

    http://www.webology.org/2007/v4n2/a41.html

  3. Niedoszły Bibliotekarz 24-10-2011 11:41

    Serdecznie dziękuję 🙂

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>