Przetwarzanie języka naturalnego w czasach powszechnego dostępu do informacji

31 stycznia 202331 stycznia 2023 KomputerowaPasja.pl

Żyjemy w czasach zdominowanych przez informacje, które trafiają do nas niezliczoną ilością kanałów. Rodzi to zarówno niesamowite możliwości rozwoju, gdyż mamy nieograniczony dostęp do wiedzy jak również możemy być zalewani fake newsami i szumem informacyjnym, który jedynie zabiera nam czas.

Powszechny dostęp do ogromnej ilości informacji jest powodem gwałtownego rozwoju metod przetwarzania języka naturalnego, co z kolei przyspiesza proces znajdowania tych informacji, które są dla nas naprawdę istotne. Przetwarzanie języka naturalnego nie tylko wspomaga proces filtrowania informacji, ale dostarcza również szereg narzędzi, które m.in. przyczyniają się do powstawania coraz to lepszych translatorów, czy chatbotów.

Wraz ze wzrostem ilości informacji płynącej do nas, mamy również do czynienia z dynamicznym rozwojem algorytmów sztucznej inteligencji. Jest to m.in. konsekwencja coraz większej dostępności maszyn, które z roku na rok udostępniają coraz większą moc obliczeniową. Śledząc historię rozwoju algorytmów przetwarzania języka naturalnego, można zaobserwować, że liczba parametrów modeli głębokiego uczenia (deep learning – DL) rośnie wykładniczo, co przedstawia poniższa grafika.

Figura 1: Wykładniczy wzrost liczby parametrów modeli DL (źródło: Microsoft Turing NLG blogspot)

Czy sztuczna inteligencja jest służbie ludzkości?

W tej sytuacji można wyciągnąć wniosek, że rozwój rozwiązań opartych o sztuczną inteligencję przyśpiesza i nie wiadomo w jakim miejscu wyhamuje. Rodzi to zarówno pozytywne jak i negatywne emocje. Z jednej strony niemal wszyscy korzystamy z rozwiązań opartych o uczenie maszynowe/głębokie, gdzie np. odpowiednie algorytmy analizują, czy nie doszło do oszustw związanych z transakcjami zawieranymi za pomocą kart kredytowych. Rozwiązania tego typu są wykorzystywane niemal przez każdy bank i w przypadku, gdy nasze newralgiczne dane wypłyną w sieci i ktoś spróbuje z nich skorzystać, to wówczas istnieje duża szansa, że algorytmy to wykryją i nie dopuszczoną do tego typu transakcji, a następnie sami zostaniemy o tym poinformowani. Z drugiej strony obawiamy się, że rozwój sztucznej inteligencji doprowadzi do redukcji wielu stanowisk pracy, gdyż sztuczna inteligencja będzie w stanie zastąpić pracę wielu osób. W skrajnych przypadkach obawiamy się o dominację sztucznej inteligencji nad ludzkością, ale to jest raczej scenariusz z filmów science-fiction.

Nieograniczone możliwości ChatGPT

W ostatnim czasie niemałe zamieszanie wywołało opublikowanie na światło dzienne modelu GPT-3 opracowanego przez OpenAI oraz opartego o ten model narzędzia ChatGPT. Obecnie nie znamy szczegółów implementacji GPT-3, natomiast wydawać się może, że GPT-3 jest oparty na całej wiedzy, która dostępna jest w internecie. Opublikowany przez OpenAI algorytm jest w stanie z nami normalnie rozmawiać, przytaczać cytaty dzieł literackich, a nawet generować kod niemal w dowolnym języku programistycznym. Co prawda odpowiedzi generowane przez czat nie są są pozbawione błędów. Można tutaj przytoczyć sytuację, gdzie prototypowo ChatGPT został zintegrowany ze Stackoverflow. Niemniej, czat został tymczasowo wyłączony z użytkowania, ponieważ generował kod z błędami. W innych sytuacjach ChatGPT ma pewne opory, aby udzielić nam odpowiedzi, np. w przypadku kiedy prosimy go o translacje. Jednak są to jedynie pewne z góry narzucone ograniczenia przez OpenAI, które można obejść. Odpowiednie pokierowanie rozmowy z ChatGPT może również doprowadzić to translacji, a także do odpowiedzi na pytania, które początkowo są problematyczne dla ChatGPT. W sieci można znaleźć dużo miejsc dostarczających informacji jak obejść ograniczenia ChatGPT.

Microsoft integruje silnik Bing z ChatGPT

Niedawno również pojawiła się informacja, że Microsoft doda funkcjonalność generatora tekstu ChatGPT do swojej wyszukiwarki Może to być swoisty gamechanger dla Microsoftu, gdyż nadal Google jest najpowszechniej wykorzystywaną wyszukiwarką. Istnieją również pogłoski, że rozwiązania dotyczące wyszukiwania opartego o ChatGPT zakończą dominację wyszukiwarki googla w przeciągu najbliższych dwóch lat.

Obecnie prace nad przetwarzaniem języka naturalnego są intensywnie rozwijane. Można sobie wyobrazić, że w najbliższej przyszłości zmieni się sposób pozyskiwania informacji. Klasyczne wyszukiwarki zostaną wyparte przez inteligentnych asystentów z którymi będziemy prowadzić normalny dialog. Dostępna w sieci wiedza będzie syntetyzowana, a dostarczana do nas odpowiedzi będą bardziej precyzyjne.

Modele NLP dostępne dla każdego

ChatGPT to potężne narzędzie, niemniej do rozwiązania wielu problemów tj. analiza sentymentu, tagowanie dokumentów, parafrazowanie tekstu nie potrzebujemy, aż tak bardzo zaawansowanego modelu AI. W praktyce często korzysta się z wcześniej pretrenowanych modeli z rodziny BERT, GPT czy T5 dostępnych na Hugging Face, które są dostrajane na potrzeby rozwiązania problemu z którym mamy do czynienia. Obecnie funkcjonalności oparte o przetwarzanie języka naturalnego aplikowane są na wielu płaszczyznach.

Notibox – platforma dla sygnalistów

Platforma dla sygnalistów Notibox, która pracuje nad wykorzystaniem NLP do badania nastrojów panujących w firmach. Wdrażanie anonimowego kanału do zgłaszania nieprawidłowości w firmach ma istotny wpływ na poczucie bezpieczeństwa pracowników. Natomiast analiza nastrojów dostarczy narzędzie umożliwiające kontrolowane poziomu bezpieczeństwa w sposób mierzalny.