Thomson Reuters vs Ross Intelligence: walka o wiedzę dla sztucznej inteligencji

May 12, 2020
Market

Thomson Reuters oraz West Publishing Corporation złożyli pozew przeciwko startupowi ROSS Intelligence, zarzucając, że ten bezprawnie wykradł treści z Westlaw, celem opracowania własnego konkurencyjnego produktu w zakresie wyszukiwarki prawniczej.

Jest to bardzo głośna sprawa, którą świat Legal tech żyje od kilku dni. Chciałbym w tym artykule podsumować ten ciekawy spór, który poza swoją złożonością i wartością merytoryczną, obrazuje kryzys dostępu do danych prawniczych.

Strony:

Westlaw to internetowa wyszukiwarka informacji prawnych i zastrzeżona baza danych dla prawników dostępna w ponad 60 krajach. Zasoby informacyjne dostępne w Westlaw obejmują ponad 28 000 baz danych orzeczeń, kodeksów, artykułów prasowych i czasopism, rejestrów publicznych, publikacji naukowych, monitorów prawnych, traktatów, i innych materiałów informacyjnych.

Od 1996 roku WestLaw jest własnością The Thomson Corporation (dalej: Thomson Reuters), kanadyjskiego międzynarodowego konglomeratu medialnego.

ROSS Intelligence jest startupem, który tworzy wyszukiwarkę prawną, opartą na sztucznej inteligencji.

LegalEase Solutions jest dostawcą usług wsparcia prawnego, oferującym korporacjom, działom prawnym i kancelariom prawnym wsparcie w zakresie tworzenia baz danych, zarządzania cyklem życia umów, przeglądu dokumentów i operacji prawnych.


Co się wydarzyło ?

W pozwie, złożonym w sądzie rejonowym w stanie Delaware, Thomson Reuters zarzuca, że ROSS "celowo i świadomie" nakłonił firmę LegalEase Solutions do wykorzystania jej konta w Westlaw do powielania danych Westlaw i masowego dostarczania ich do ROSS".

Powód odmówił wcześniej udzielenia ROSS licencji na korzystanie z Westlaw, ze względu na to, że ROSS stanowił dla niego konkurencję. Zdaniem Thomson Reuters to właśnie z tego względu, ROSS postanowił, że w sposób nieuprawniony zdobędzie i wykorzysta dane zgromadzone w Westlaw za pośrednictwem LegalEase.

Dlaczego ROSS tak bardzo potrzebował tej bazy danych? Firma opracowała narzędzie, które ma zrewolucjonizować dostęp do informacji prawnej. Sztuczna inteligencja, na której opiera się ROSS pozwala między innymi:

  • Wyszukiwać bazę materiałów w oparciu o pytania pozwalające na zadawanie pytań prawnych w języku ludzkim (na przykład odnaleźć wszystkie odpowiednie teksty, orzecznictwa i publikacje wpisując “Czy w przypadku cofnięcia powództwa przed pierwszą rozprawą, sąd zwraca opłatę od pozwu?”).
  • Zidentyfikować podobne zwroty, aby znaleźć inne sprawy o podobnej treści.
  • Generować automatyczne streszczenie wyroków z uwzględnieniem kwestii interesujących danego użytkownika.

Brzmi wspaniale, prawda? Jednak aby taka sztuczna inteligencja (ale i przede wszystkim baza danych do wyszukiwarki) mogła funkcjonować i przede wszystkim ewoluować, potrzebuje ona ogromnej ilości danych. Dane te znajdują się m.in. w ustawach, orzeczeniach, publikacjach naukowych, rejestrach publicznych itp. O ile większość tych źródeł jest w teorii ogólnie dostępna, to w praktyce, monitorowanie, zbieranie, opracowanie oraz wykorzystywanie tych danych wymaga dużych zasobów, zarówno ludzkich jak i finansowych i technologicznych.

Z tego względu, zdaniem Thomson Reuters, ROSS, w ramach współpracy z LegalEase (który miał dostęp do Westlaw), zlecił mu pobieranie i dostarczanie dużej ilości zasobów z bazy danych Westlaw, mających służyć do zasilania narzędzia opracowanego przez ROSS tj. wzbogacić bazę danych oraz uczyć sztuczną inteligencję.

Westlaw nabrał podejrzeń, gdy korzystanie z Westlaw przez LegalEase wzrosło ze średnio 6.000 zapytań miesięcznie do około 236.000 zapytań miesięcznie (tj. prawie 40-krotnie).

Zdaniem Thomson Reuters, ROSS miał na celu “Wypuszczenie konkurencyjnego produktu bez konieczności poświęcania zasobów, energii twórczej i czasu na jego samodzielne tworzenie”.

W związku z tym, dalej cytując pozew "ROSS dopuścił się bezpośredniego naruszenia praw autorskich poprzez powielanie i tworzenie dzieł pochodnych na podstawie treści powoda, a także ponosi wtórną odpowiedzialność za naruszenie praw autorskich przez LegalEase".

ROSS broni się twierdząc, że "Składając ten pozew, pomimo jego bezzasadności, Westlaw ingeruje w nasze szanse na pozyskanie większych funduszy lub połączenie się z innymi firmami, co musimy zrobić, aby wprowadzić innowacje i konkurować z Westlaw.”

Nie zamierzam dokonywać tutaj analizy narzędzi oraz rozwiązań proponowanych przez strony sporu ani przesądzać o wyniku sprawy (która jest w toku).

Chciałbym jednak zwrócić uwagę na najciekawsze problemy prezentowane w tej sprawie.


Jakie wnioski z tego płyną?

W mojej ocenie, głównym zagadnieniem jest problem związany z brakiem dostępu do powszechnej, darmowej i kompleksowej bazy danych prawnych, a w szczególności orzecznictw.

Prowadzi to do tego, że kluczowe dane, są w rękach prywatnych podmiotów, które szybciej niż instytucje państwowe, zrozumiały wartość i niezbędność zbierania, organizowania oraz przetwarzania danych prawnych.

Rozumiem oczywiście stanowisko firm, które musiały poświęcić duże zasoby aby uczynić to, co powinno być zrobione przez organy wymiaru sprawiedliwości. Mam na myśli opracowanie systemów, które pozwalają na szybki, wiarygodny i precyzyjny dostęp do informacji prawnej. Z oczywistych powodów firmy te będą chronić przewagę konkurencyjną, którą udało im się zdobyć.

Jest to zatem sygnał dla organów państwowych: rzeczywista i konkretna polityka Open Data orzecznictw mogłaby wpłynąć na znajomość prawa przez społeczeństwo, ale i otworzyć drzwi do nowych rozwiązań lawtechowych.

Nie ulega wątpliwości, że w dobie transformacji cyfrowej, udostępnianie skanów wyroków (nie czytelnych przez maszynę która nie posiada OCR - Optical Character Recognition) nie jest wystarczające. Maszyna, za pośrednictwem nowych narzędzi będzie w przyszłości w pewnym zakresie łączyć człowieka i system prawny, zatem maszyna musi zrozumieć ten system.

Wymagać to będzie znacznych nakładów, lecz bez tego, prawo nie nadąża za cyfrowym społeczeństwem.


Brak dostępu do danych w konsekwencji powoduje także ryzykowne zachowania po stronie tych, którzy tych danych potrzebują, aby tworzyć i rozwijać nowe narzędzia.

Naruszenia pojawiły się również we Francji, gdzie LexisNexis, Dalloz, Lexbase, Lextenso i Wolters Kluwer (Lamy) pozwali startup Doctrine za dopuszczenie się czynów nieuczciwej konkurencji, poprzez stosowanie wprowadzającej w błąd reklamy i pasożytnictwo. Doctrine został oskarżony o stosowanie “nieetycznych manewrów” w celu zebrania orzeczeń sądowych i wprowadzenia ich do wyszukiwarki.  


Wracając do konieczności “Open Data”. Publicznie dostępne dane prawne (w pierwszej kolejności orzecznictwa) powinny ponadto być ustrukturyzowane tj. udostępniane w sposób wysoko zorganizowany i łatwo zrozumiały dla języka maszynowego. Pozwoli to na stosunkowo szybkie wprowadzanie, wyszukiwanie i przetwarzanie danych.

Bez wątpliwości pozwoli to podmiotom (głównie z branży Lawtech) znacznie polepszyć dostęp do prawa oraz zrozumiałość naszego systemu.

Marzy mi się także przyszłość, w której ustawy będą przygotowywane z myślą o ich publikacji w formie ustrukturyzowanej bazy danych. Możliwości dla szeroko pojętego wymiaru sprawiedliwości będą wtedy niemalże nieskończone. Ale to już chyba Science Fiction...


Roman Kaczynski

I assist law firms and in-house legal departments in their digital transformation.

My legal education, complemented by practical experience in different legal tech companies and by various training courses in innovation management, allows me to identify the needs of lawyers and their clients and thus implement or create technological and organisational solutions adapted to the new realities.

Experienced in change management related to transformation programs (stakeholder assessment, change impact analysis, organization design, communication planning, training support).

Related Posts