plenLiteracka Sp. z o.o.    |   Olsztyn, Wilczyńskiego 25e/216
+48 883 00 88 22

Automatyczny recenzent książek

Dr Marek Maruszczak, kierownik prac B+R w Literackiej, wystąpi na konferencji Media Biznes Kultura. Pomorze 2021, która odbędzie się 14-15 października 2021 r., gdzie zaprezentuje przebieg i wyniki prac Literackiej nad innowacyjnym systemem rekomendacyjnym książek. Poniżej prezentujemy zapowiedź wystąpienia, które zostanie wygłoszone podczas sympozjum. 

Celem badań Literackiej było stworzenie i wdrożenie prototypu systemu rekomendacji książek wykorzystującego automatyczną analizę treści przez sztuczną inteligencję, tj. z wykorzystaniem sieci neuronowych i metod przetwarzania języka naturalnego. 

Tradycyjne systemy rekomendacji stosowane w księgarniach internetowych, ale również w bibliotekach opierają się przede wszystkim na trzech głównych metodach:  content filtering, collaborative filtering oraz association rule mining. Metoda collaborative filtering wykorzystuje tzw. mądrość tłumu, tzn. bazuje na założeniu, że podobni do siebie użytkownicy dokonują takich samych decyzji. Podejście content filtering skupia się natomiast na analizie przedmiotu zainteresowania użytkownika (content). System rekomendacji oparty na tym założeniu proponuje przedmioty podobne lub pozostające w innej relacji do przedmiotów, które już wcześniej stanowiły obiekt zainteresowania danego odbiorcy. Trzecia z najczęściej stosowanych metod to tzw. analiza koszykowa. Analizowane są tzw. koszyki, czyli listy zakupowe różnych klientów lub czytelników. 

Problem badawczy polegał na stworzeniu systemu rekomendacji opartego na tzw. miękkich cechach fabuły. W tym celu w oprogramowaniu zaimplementowano algorytmy przypisujące pisanym treściom ocenę wydźwięku na podstawie zestawu ocen dla poszczególnych książek.

Badania, które doprowadziły do powstania automatycznego recenzenta były pierwszymi na tę skalę badaniami długich tekstów w języku polskim. Na ich potrzeby utworzono bazę 60 000 tytułów książek w języku polskim, 30 000 pełnotekstowych wydań elektronicznych pozyskanych w ramach współpracy z Publio.pl, w tym 10 000 tytułów z kategorii literatura faktu i beletrystyka dla dorosłych. Książki te posłużyły później do wyuczenia algorytmów sztucznej inteligencji. Aktualna wersja automatycznego recenzenta jest w stanie “przeczytać” książkę w ciągu około 5s i na tej podstawie ocenić jej cechy miękkie ze skutecznością 90% podobieństwa do ludzkiego czytelnika. W ocenie przynależności gatunkowej (komedia, kryminał itd.) sztuczna inteligencja jest natomiast nawet bardziej skuteczna od człowieka.

Utworzony system rekomendacyjny również spełnił swoje zadanie zwiększając konwersję (odwiedzenie strony kupno/wypożyczenie) na stronach internetowych partnerów aż o 65%. Prace nad systemem doprowadziły do opracowania dwóch całkowicie nowych strategii rekomendacji: Gravity Mean oraz More Expert, których skuteczność została potwierdzona w testowych wdrożeniach na trzech stronach internetowych: codoczytania.pl, szukamksiazki.pl oraz Publio.pl – w formie pluginu. Nowo opracowane strategie okazały się na tyle obiecujące, że badania nad ich skutecznością i innymi zastosowaniami będą kontynuowane.

Related Posts

Leave a Reply