Jak wykryć tekst napisany przez AI? Po tym poznasz maszynę

Jak wykryć tekst napisany przez AI? Po tym poznasz maszynę

Sztuczna inteligencja
Sztuczna inteligencja 
Sztuczna inteligencja coraz częściej jest używana do generowania tekstu. Jak się okazuje, wprawne oko jest jednak w stanie wykryć, co napisał człowiek, a co maszyna. W niedalekiej przyszłości będzie to zaś coraz ważniejsza umiejętność.

Po tym, jak organizacja OpenAI zaprezentowała światu najnowszego chatbota ChatGPT, internet zalała fala konwersacji i memów na temat działania systemu. Narzędzie nie jest jeszcze idealne, ale potrafi całkiem zręcznie składać zdania nawet w niełatwym języku polskim.

Z biegiem czasu tego typu algorytmy będą coraz bardziej rozpowszechnione i trudniejsze do odróżnienia od człowieka. Istnieje jednak parę sposobów na poznanie materiału stworzonego przez maszynę.

Jak działa chatbot AI ChatGPT

By zwietrzyć nosem pismo AI, należy najpierw poznać wroga. Wytwory ChatGPT to najczęściej niezwykle „ludzko brzmiące” zdania. Dlaczego? Bo w konwersacji ze sztuczną inteligencją obserwujemy poprawne słowa ułożone w znanej nam kolejności.

Prawda jest jednak taka, że AI nie rozumie, co do nas pisze. Z taką samą pewnością będzie nam więc opowiadać o faktach, jak i wciskać absolutny fałsz.

AI tworzy wypowiedzi przewidując najbardziej prawdopodobne następne słowo w układanym zdaniu. Po prostu dobiera słowa w poznane wcześniej ustawienia i liczy, że wszystko będzie się zgadzało. Tak maszyna tworzy „iluzje poprawności” i pisze w wielu językach, nie musząc ich znać.

Jak odróżnić człowieka od chatbota AI

Naukowcy i badacze AI już od dłuższego czasu zadają sobie powyższe pytanie. Przez lata wypracowali parę prostych, ale też nieco bardziej skomplikowane metody. Ba, stworzyli nawet algorytmy badające czy dany tekst został napisany przez algorytm. Ale od początku.

Jedną z podstawowych metod jest wykrycie w tekście często używanych słow. – Jeśli mamy przed sobą wystarczająco długi tekst, bardzo prostym do zauważenia manieryzmem jest nadmierne używanie „the” – zaznacza Daphne Ippolito, starsza badaczka w  Brain.

Jako że AI polega na predykcji, częściej niż człowiek używa najpopularniejszych słów jak „the”, „it” czy „is”. Korzystając z tak zwanych list frekwencyjnych zasadę tę dość prosto można przełożyć na polski. Warto zwracać uwagę na często pojawiające się:

  • się,
  • i,
  • w,
  • nie,
  • na,
  • z,
  • do,
  • to,
  • że,
  • a,
  • o,
  • jak.

Ciekawym wnioskiem z badań Ippolito jest fakt, że ludzie wpadają w pewną pułapkę. „Czysto wyglądające” zdania, w których często padają najpopularniejsze słowa, po prostu lepiej wyglądają dla ludzkiego oka. Lepszą jakość tekstu badani przypisują zaś ludziom, nawet jeśli materiał pochodził od AI.

Inną ciekawą metodą jest przeczytanie tekstu na głos. Podobno materiał napisany przez AI dobrze czyta się na ekranie, ale mniej naturalnie brzmi po wypowiedzeniu. Szukać należy zdań i fraz, które zaburzają nam płynność czytania.

Oczywiście naukowcy mają też wiele innych parametrów, a ich programy dodatkowo wyczulone są na określone schematy znaków przestankowych czy powtarzające się zdania o określonej długości. Ludzie zwykle łączą w akapitach długie i krótkie zdania. Sztuczna inteligencja stara się tworzyć zdania o podobnej długości.

Tekst napisał człowiek… bo są błędy

Specjaliści zwracają uwagę, że człowiek zastosuje też w napisanym materiale bardzo dużą wariację, użyje słow slangowych, zapożyczeń, skrótów i tak dalej.

Koronnym sposobem na potwierdzenie, że materiał napisał człowiek, jest jednak… literówka. – Modele językowe bardzo, bardzo rzadko robią błędy, czy literówki. Są bardzo dobre w generowaniu perfekcyjnych gramatycznie tekstów – zaznacza Ippolito.

Czytaj też:
SMS zamiast tabletki? Chatbot, który pociesza w czasach pandemii
Czytaj też:
Kolejny chatbot wyłączony za rasizm i homofobię. „Głęboko przepraszamy”

Źródło: MIT Technology Review