Ikastaroaren ikuspegi orokorra Ikasgaiak Nola ulertzen dute hizkuntza?
4. modulua / 8

Nola ulertzen dute hizkuntza?

Chatbot-ek eta hizkuntza-ereduek ez dute hizkuntza guk bezala ulertzen. Testu askotan agertzen diren patroietan eta hitzen arteko probabilitateetan oinarrituta sortzen dituzte erantzunak.

Ertaina 18 min Hizkuntza-ereduak + mini-quiz + glosarioa

Zer egiten du hizkuntza-eredu batek?

Hizkuntza-eredu batek testu kopuru handiak aztertzen ditu, eta hitzak edo esaldi zatiak elkarrekin nola agertzen diren ikasten du. Horrela, galdera edo testu baten ondoren zein hitz etor daitekeen probableena den kalkulatzen saiatzen da.

Horrek esan nahi du sistema batek ez duela benetako ulermen kontzienterik. Ez daki zer den "egia", ez du esperientziarik, eta ez du asmorik. Baina patroi estatistiko askoren bidez, oso erantzun sinesgarriak sor ditzake, eta horregatik ematen du batzuetan benetan ulertzen duela.

Badakizu?

Tonu segurua ez da ulermenaren froga

Chatbot batek tonu ziur eta argian idatz dezake, baina horrek ez du esan nahi esandakoa egia denik edo benetan "ulertu" duenik. Askotan, probabilitate handieneko hitz-segida osatzen ari da.

Kontzeptu klabeak

Hizkuntza-eredua

Testu askotatik ikasitako patroietan oinarrituta hurrengo hitza aurresaten duen sistema.

Tokenak

Testua zatitan banatzeko unitateak dira; hitz osoak edo hitz zatiak izan daitezke.

Probabilitatea

Ereduak kalkulatzen du zein hitz edo token den probableena aurreko testuinguruan.

Testuingurua

Aurreko hitzek eta esaldiek baldintzatzen dute zer erantzun emango duen sistemak.

Nola sortzen du erantzuna?

1
Testua jasotzea

Sistemak galdera edo prompt bat jasotzen du, eta testuingurua identifikatzen hasten da.

2
Tokenetan zatitzea

Testua unitate txikiagotan banatzen da, hitzak edo hitz-zatiak modu eraginkorrean tratatzeko.

3
Patroiak aktibatzea

Entrenamenduan ikasitako milioika lotura estatistiko erabiltzen ditu testuinguru horri erantzuteko.

4
Hurrengo hitza aurresatea

Une horretan probableena den tokena aukeratzen du, eta prozesua berriro errepikatzen da.

5
Esaldia osatzea

Tokenak bata bestearen atzetik eraikiz, erantzun luze eta kohesionatu bat sortzen da.

🔬 Bisualizadore interaktiboa

Ikusi zuzenean nola sortzen duen hizkuntza-eredu batek testua, token bakoitza pauso batean aukeratuz. Sakatu "Analisia hasi" prozesua ikusteko.

Hasierako testua (prompt-a)

Adimen artifiziala teknologia bat da

Prozesuaren pausoak

1. Testua jasotzea: Prompt-a irakurri
2. Tokenetan zatitzea: Unitatetan banatu
3. Patroiak aktibatzea: Testuingurua aztertu
4. Aurreikuspena: Hurrengo tokena aukeratu
5. Esaldia osatzea: Prozesua errepikatu

2. Tokenetan zatitzea

Tokenak hemen agertuko dira...

Sistemak testua unitate txikiagotan banatzen du (tokenak).

3-4. Hurrengo tokenaren probabilitatea

Probabilitate handienak kalkulatzen...

Ereduak tokenen probabilitateak kalkulatzen ditu testuinguruan oinarrituta.

5. Sortutako testua osoa

Sortutako testua hemen agertuko da...

Ereduak token bat hautatzen du, gero beste bat, eta horrela jarraitzen du esaldia osatu arte.

Eguneroko adibideak

Txatbot-ak

Galdera bati testu bidez erantzuten diote, aurreko testuaren probabilitate-patroiak erabiliz.

Itzultzaile automatikoak

Hizkuntza batetik bestera pasatzean, esaldi egokien aukerak kalkulatzen dituzte.

Testu-autobetetzea

Mugikorreko teklatuak edo posta elektronikoko iradokizunak hurrengo hitza asmatzen saiatzen dira.

Laburpen automatikoak

Testu luze baten puntu nagusiak berrantolatzen dituzte, aurretik ikasitako egituren bidez.

Mugak eta gaizki-ulertuak

Hizkuntza-eredu batek ez du egia eta gezurra berez bereizten. Testu sinesgarria sor dezake, baina akatsekin, asmakizunekin edo erreferentzia faltsuekin. Horregatik, bere erantzunak ezin dira automatikoki egiazkotzat hartu.

Gainera, testuingurua nahasia bada edo galdera lausoa bada, erantzuna ere lausoagoa edo okerragoa izan daiteke. Hori dela eta, prompt argiak idaztea eta informazioa iturri fidagarrietan egiaztatzea funtsezkoa da.

Hausnarketa

Pentsatu chatbot bati egin diozun azken galderan. Zergatik ematen zuen ulertu zintuela? Zer seinale erabiltzen dituzu zuk "ulermen" hori benetakoa dela pentsatzeko? Eta zer arrisku dago hori gehiegi sinestean?

Mini-quiza

1. Zer egiten du hizkuntza-eredu batek batez ere?

Hizkuntza-ereduek testu-patroi estatistikoak erabiltzen dituzte hurrengo token probableena aukeratzeko.

2. Zergatik dira arriskutsuak batzuetan chatbot-en erantzunak?

Tonu seguruak eta estilo zainduak ez dute egiazkotasuna bermatzen; horregatik behar da egiaztapena.

Glosarioa

Hizkuntza-eredua

Testu patroietan oinarrituta hitz-segidak sortzen dituen AA sistema.

Tokena

Testua prozesatzeko erabiltzen den unitate txikia, hitza edo hitz-zatia izan daitekeena.

Testuingurua

Aurreko testuak eta egoerak baldintzatzen duten informazio multzoa.

Probabilitatea

Hurrengo elementu bat agertzeko aukera estatistikoa.

Haluzinazioa

AAk sinesgarria dirudien baina okerra edo asmatua den informazioa sortzea.