loading...
loading...

De ce este atât de dificilă detectarea textului generat de inteligența artificială (și ce să faci în privința asta)

OpenAI și Detectorul de Text Generat de AI

În ultima săptămână, OpenAI a dezvăluit un instrument care poate detecta textul produs de sistemul său AI ChatGPT. Cu toate acestea, acest instrument este încă în curs de dezvoltare și nu este foarte fiabil.

Prezentarea detectorului de text

Detectorul de text al OpenAI a fost creat ca răspuns la critici din partea educatorilor, jurnaliștilor și altor persoane pentru lansarea ChatGPT fără modalități de a detecta textul generat de acesta. Cu toate acestea, instrumentul este încă într-un stadiu incipient și este destul de nesigur. OpenAI afirmă că detectorul său AI identifică corect 26% din textul scris de AI ca fiind „probabil scris de AI”.

Limitările detectorului de text

Deși OpenAI are încă mult de lucru pentru a-și rafina instrumentul, există o limită în cât de bun îl poate face. Este puțin probabil să obținem vreodată un instrument care să poată detecta textul generat de AI cu o certitudine de 100%. Detectarea textului generat de AI este dificilă, deoarece întregul scop al modelelor AI de limbaj este de a genera text fluent și asemănător cu cel uman, iar modelul imită textul creat de oameni, spune Muhammad Abdul-Mageed, profesor care supraveghează cercetările în procesarea limbajului natural și învățarea automată la Universitatea din British Columbia.

Cauzele dificultății în detectarea textului generat de AI

Ne aflăm într-o cursă pentru a construi metode de detecție care să țină pasul cu cele mai recente și puternice modele AI, adaugă Abdul-Mageed. Noile modele AI de limbaj sunt mai puternice și mai bune în a genera limbaj fluent, ceea ce face ca instrumentele noastre actuale de detecție să devină rapid învechite.

Metoda de construcție a detectorului

OpenAI și-a construit detectorul prin crearea unui întreg nou model de limbaj AI asemănător cu ChatGPT, care este special antrenat pentru a detecta rezultatele provenite de la modele ca el însuși. Deși detaliile sunt puține, se pare că compania a antrenat modelul cu exemple de text generat de AI și exemple de text generat de oameni, și apoi l-a rugat să identifice textul generat de AI. Am cerut mai multe informații, dar OpenAI nu a răspuns.

Metoda alternativă: Filigranele

Luna trecută, am scris despre o altă metodă pentru detectarea textului generat de AI: filigranele. Acestea acționează ca un fel de semnal secret în textul produs de AI, permițând programelor informatice să-l detecteze ca atare.

Cercetătorii de la Universitatea din Maryland au dezvoltat o modalitate ingenioasă de a aplica filigrane textului generat de modelele AI de limbaj și au făcut-o disponibilă gratuit. Aceste filigrane ne-ar permite să identificăm cu aproape deplină certitudine când textul generat de AI a fost folosit.

Aplicarea filigranelor în modele AI

Problema este că această metodă necesită ca firmele AI să integreze filigranele în chatbot-urile lor încă de la început. OpenAI dezvoltă aceste sisteme, dar nu le-a implementat încă în niciunul dintre produsele sale. De ce întârzierea? Un motiv ar putea fi că nu este întotdeauna de dorit să avem text generat de AI filigranat.

Problemele cu integrarea filigranelor

Una dintre cele mai promițătoare modalități prin care ChatGPT ar putea fi integrat în produse este ca instrument pentru a ajuta oamenii să scrie e-mailuri sau ca un corector ortografic îmbunătățit într-un procesor de text. Asta nu înseamnă neapărat trisare. Dar filigranarea întregului text generat de AI ar putea marca automat aceste rezultate și ar putea duce la acuzații eronate.

Utilizarea combinată a unor metode diferite pentru detectarea textului generat de AI

Detectorul de text AI lansat de OpenAI este doar unul dintre multe instrumente, iar în viitor va fi probabil necesar să utilizăm o combinație dintre ele pentru a identifica textul generat de AI. Un alt instrument nou, numit GPTZero, măsoară cât de aleatorii sunt fragmentele de text. Textul generat de AI utilizează mai multe dintre aceleași cuvinte, în timp ce oamenii scriu cu mai multă variație. Așa cum se întâmplă și cu diagnosticul medicilor, spune Abdul-Mageed, atunci când folosim instrumente de detecție AI, este o idee bună să obținem o a doua sau chiar o a treia opinie.

Schimbarea modului în care evaluăm textul scris

Una dintre cele mai mari schimbări determinate de ChatGPT ar putea fi modificarea modului în care evaluăm textul scris. În viitor, poate că elevii nu vor mai scrie totul de la zero, iar accentul se va pune pe conceperea unor gânduri originale, spune Sebastian Raschka, un cercetător AI care lucrează la startup-ul AI Lightning.AI. Eseurile și textele generate de ChatGPT vor începe în cele din urmă să semene între ele, deoarece sistemul AI se va epuiza de idei, fiind limitat de programarea sa și de datele din setul său de instruire.

Scrierea corectă vs. scrierea originală

Raport nou: Inteligența artificială generativă în designul și ingineria industrială

AI-ul generativ – cea mai fierbinte tehnologie a acestui an – transformă întregi sectoare, de la jurnalism și designul de medicamente până la designul și ingineria industrială. Va fi mai important ca niciodată pentru liderii acestor industrii să rămână înainte. Vă avem acoperiți. Un nou raport de cercetare de la MIT Technology Review evidențiază oportunitățile – și capcanele potențiale – ale acestei noi tehnologii pentru designul și ingineria industrială.

Învățare mai profundă: Modelele AI generează imagini protejate de drepturile de autor și fotografii ale unor persoane reale

Modele populare de generare de imagini, precum Stable Diffusion, pot fi îndemnate să producă fotografii identificabile ale unor persoane reale, punând în pericol intimitatea acestora, potrivit unor cercetări noi. Lucrarea arată, de asemenea, că aceste sisteme AI pot fi făcute să regurgiteze copii exacte ale imaginilor medicale, precum și ale lucrărilor protejate de drepturile de autor ale artiștilor.

De ce contează aceasta?

Măsura în care aceste modele AI memorează și regurgitează imaginile din bazele lor de date este la baza mai multor procese între companiile AI și artiști. Această descoperire ar putea întări cazul artiștilor. Citiți mai multe despre acest lucru.

Modele AI cu scurgeri de informații

Din păcate, în încercarea de a lansa noi modele mai rapid, dezvoltatorii de AI trec adesea cu vederea aspectele legate de confidențialitate. Și nu este vorba doar de sistemele de generare de imagini. Modelele de limbaj AI sunt, de asemenea, extrem de “scurgeri”, așa cum am descoperit când am întrebat GPT-3, predecesorul ChatGPT, ce știa despre mine și redactorul-șef al MIT Technology Review. Rezultatele au fost amuzante și înfricoșătoare.

Biți și octeți

Când tatăl meu era bolnav, am început să caut informații despre doliu pe Google. Apoi nu am mai putut să scap de aceste informații. Un articol emoționant al colegului meu Tate Ryan-Mosley despre doliu și moarte și despre algoritmii de recomandare a conținutului care o urmăresc pe internet pentru a-i oferi mai mult conținut despre doliu și moarte. Tate a petrecut luni întregi întrebând experții cum putem obține mai mult control asupra algoritmilor rătăciți. Răspunsurile lor nu sunt prea mulțumitoare. (MIT Technology Review)

Google a investit 300 de milioane de dolari într-un startup AI

Gigantul tehnologic este cel mai recent care s-a alăturat valului de AI generativ. A investit bani în startup-ul Anthropic, care dezvoltă modele de limbaj similare cu ChatGPT. Tranzacția oferă Google o participație de 10% în companie în schimbul puterii de calcul necesare pentru a rula modele mari de AI. (The Financial Times)

Cum a declanșat ChatGPT o cursă AI

Acesta este un scurt articol despre culisele OpenAI și despre modul în care au decis să lanseze ChatGPT ca o modalitate de a obține feedback pentru modelul de limbaj AI de generație viitoare, GPT-4. Succesul chatbot-ului a fost o “surpriză zguduitoare” în cadrul OpenAI. (The New York Times)

Concluzie

În concluzie, ChatGPT și alte modele AI au un impact semnificativ asupra modului în care evaluăm și detectăm textele scrise. Cu toate acestea, există încă multe provocări și obstacole pe care companiile AI și utilizatorii trebuie să le depășească pentru a menține integritatea și originalitatea conținutului.

Întrebări frecvente

Ce este ChatGPT și de ce este important?

ChatGPT este un sistem de limbaj AI dezvoltat de OpenAI, care poate genera text coerent și similar cu cel scris de oameni. Este important deoarece poate fi integrat în diverse produse, cum ar fi asistenți de redactare sau corectoare ortografice, dar ridică și probleme legate de originalitate și detectarea textelor generate de AI.

Ce metode de detectare a textelor generate de AI există în prezent?

Unele metode includ detectorul de texte AI dezvoltat de OpenAI, marcajele de apă aplicate de cercetătorii de la Universitatea din Maryland și un alt instrument numit GPTZero, care măsoară cât de aleatorii sunt pasajele de text.

De ce este dificil să se detecteze textele generate de AI?

Este dificil deoarece modelele de limbaj AI sunt concepute pentru a genera text fluent și asemănător cu cel uman, imitând textele create de oameni. Pe măsură ce modelele AI devin mai avansate, devine și mai greu să le deosebim de textele scrise de oameni.

Ce schimbări ar putea aduce ChatGPT în evaluarea textelor scrise?

ChatGPT ar putea schimba modul în care evaluăm textele scrise, punând accentul pe generarea de idei originale, în loc să scriem totul de la zero. Deoarece modelele AI sunt limitate de programare și setul lor de date, textele generate de ChatGPT ar putea începe să semene între ele pe măsură ce sistemul rămâne fără idei noi.

Cum ar putea afecta descoperirile legate de regurgitarea imaginilor de către modelele AI relația dintre companiile AI și artiști?

Aceste descoperiri ar putea întări cazul artiștilor în litigiile dintre ei și companiile AI, deoarece evidențiază gradul în care modelele AI memorează și regurgitează imaginile din bazele lor de date, inclusiv lucrările protejate de drepturile de autor ale artiștilor.