Root NationRakstiTehnoloģijasKas ir neironu tīkli un kā tie darbojas?

Kas ir neironu tīkli un kā tie darbojas?

-

Šodien mēs mēģināsim noskaidrot, kas ir neironu tīkli, kā tie darbojas un kāda ir to loma mākslīgā intelekta veidošanā.

Neironu tīkli. Mēs dzirdam šo frāzi gandrīz visur. Sanāk, ka neironu tīklus atradīsit pat ledusskapjos (tas nav joks). Neironu tīklus plaši izmanto mašīnmācīšanās algoritmi, kas mūsdienās sastopami ne tikai datoros un viedtālruņos, bet arī daudzās citās elektroniskajās ierīcēs, piemēram, sadzīves tehnikā. Un vai esat kādreiz domājuši, kas ir šie neironu tīkli?

Neuztraucieties, šī nebūs akadēmiska lekcija. Ir daudz publikāciju, tostarp ukraiņu valodā, kas ļoti profesionāli un ticami izskaidro šo jautājumu eksakto zinātņu jomā. Šādas publikācijas ir vairāk nekā desmit gadus vecas. Kā tas iespējams, ka šīs vecās publikācijas joprojām ir aktuālas? Fakts ir tāds, ka neironu tīklu pamati nav mainījušies, un pati koncepcija - mākslīgā neirona matemātiskais modelis - tika radīts Otrā pasaules kara laikā.

Kas ir neironu tīkli un kā tie darbojas?

Tas pats ar internetu, šodien internets ir nesalīdzināmi attīstītāks nekā tad, kad tika nosūtīts pirmais e-pasts. Interneta pamati, fundamentālie protokoli, pastāvēja jau no tā izveides sākuma. Katra sarežģīta koncepcija ir balstīta uz veco konstrukciju pamatiem. Tāpat ir ar mūsu smadzenēm, jaunākā smadzeņu garoza nespēj funkcionēt bez vecākā evolūcijas elementa: smadzeņu stumbra, kas mūsu galvās ir bijis daudz senāks par mūsu sugu pastāvēšanu uz šīs planētas.

Vai es tevi mazliet sajaucu? Tāpēc sapratīsim sīkāk.

Interesanti arī: ChatGPT: vienkāršas lietošanas instrukcijas

Kas ir neironu tīkli?

Tīkls ir noteiktu elementu kopums. Šī ir vienkāršākā pieeja matemātikā, fizikā vai tehnoloģijās. Ja datortīkls ir savstarpēji savienotu datoru kopums, tad neironu tīkls acīmredzot ir neironu kopums.

neironu tīklu

Tomēr šie elementi sarežģītības ziņā pat nav salīdzināmi ar mūsu smadzeņu un nervu sistēmas nervu šūnām, taču noteiktā abstrakcijas līmenī dažas mākslīgā neirona un bioloģiskā neirona pazīmes ir izplatītas. Bet ir jāatceras, ka mākslīgais neirons ir daudz vienkāršāks jēdziens nekā tā bioloģiskais līdzinieks, par kuru mēs joprojām nezinām visu.

- Reklāma -

Lasi arī: 7 stilīgākie ChatGPT lietojumi

Vispirms bija mākslīgais neirons

Pirmo mākslīgā neirona matemātisko modeli 1943. gadā (jā, tā nav kļūda, Otrā pasaules kara laikā) izstrādāja divi amerikāņu zinātnieki Vorens Makulohs un Valters Pits. Viņiem tas izdevās, balstoties uz starpdisciplināru pieeju, apvienojot pamatzināšanas smadzeņu fizioloģijā (atcerieties laiku, kad tika izveidots šis modelis), matemātiku un tolaik jauno IT pieeju (viņi cita starpā izmantoja Alana Tjūringa aprēķinamības teoriju ). McCulloch-Pitts mākslīgā neirona modelis ir ļoti vienkāršs modelis, tam ir daudz ievades, kur ievades informācija iet caur svariem (parametriem), kuru vērtības nosaka neirona uzvedību. Iegūtais rezultāts tiek nosūtīts uz vienu izvadi (skatiet McCulloch-Pitts neirona diagrammu).

neironu tīklu
Mākslīgā neirona shēma 1. Neironi, kuru izejas signāli tiek ievadīti dotā neirona ieejā 2. Ieejas signālu summators 3. Pārneses funkciju kalkulators 4. Neironi, uz kuru ieejām tiek pievadīts dotā neirona signāls 5. ωi — ieejas signālu svari

Šāda kokam līdzīga struktūra ir saistīta ar bioloģisko neironu, jo, domājot par zīmējumiem, kuros attēlotas bioloģiskās nervu šūnas, prātā nāk raksturīgā dendrītu kokam līdzīgā struktūra. Tomēr nevajadzētu ļauties ilūzijai, ka mākslīgais neirons ir vismaz kaut cik tuvu reālai nervu šūnai. Šiem diviem pētniekiem, pirmā mākslīgā neirona autoriem, izdevās pierādīt, ka jebkuru izskaitļojamu funkciju var aprēķināt, izmantojot savstarpēji savienotu neironu tīklu. Tomēr atcerēsimies, ka šie pirmie jēdzieni tika radīti tikai kā idejas, kas pastāvēja tikai "uz papīra" un kurām nebija īstas interpretācijas darbības iekārtu veidā.

Lasi arī: Par kvantu datoriem vienkāršos vārdos

No modeļa līdz novatoriskām ieviešanām

McCulloch un Pits izstrādāja teorētisko modeli, bet pirmā reālā neironu tīkla izveide bija jāgaida vairāk nekā desmit gadus. Par tās radītāju tiek uzskatīts vēl viens mākslīgā intelekta pētījumu pionieri Frenks Rozenblats, kurš 1957. gadā izveidoja Mark I Perceptron tīklu, un jūs pats parādījāt, ka, pateicoties šai struktūrai, mašīna ieguva spēju, kas iepriekš bija raksturīga tikai dzīvniekiem un cilvēkiem: tā var mācīties. Tomēr tagad mēs zinām, ka patiesībā bija arī citi zinātnieki, kuri nāca klajā ar ideju, ka mašīna varētu mācīties, tostarp pirms Rozenblata.

Marks I Perceptrons

Daudzi pētnieki un datorzinātņu pionieri 1950. gados nāca klajā ar ideju par to, kā panākt, lai mašīna paveiktu to, ko tā pati nespēj. Piemēram, Arturs Semjuels izstrādāja programmu, kas spēlēja dambreti ar cilvēku, Alens Ņūls un Herberts Saimons izveidoja programmu, kas varētu patstāvīgi pierādīt matemātiskās teorēmas. Vēl pirms Rozenblata pirmā neironu tīkla izveides divi citi mākslīgā intelekta pētniecības pionieri Mārvins Minskis un Dīns Edmonds 1952. gadā, tas ir, vēl pirms Rozenblata perceptrona parādīšanās, uzbūvēja mašīnu ar nosaukumu SNARC (Stochastic Neural). Analogā pastiprinājuma kalkulators) - stohastiskā neironu analogā kalkulatora pastiprinājums, ko daudzi uzskata par pirmo stohastisko neironu tīkla datoru. Jāpiebilst, ka SNARC nebija nekāda sakara ar mūsdienu datoriem.

SNARC

Jaudīgā iekārta, izmantojot vairāk nekā 3000 elektronisko lampu un rezerves autopilota mehānismu no bumbvedēja B-24, spēja simulēt 40 neironu darbību, kas izrādījās pietiekami, lai matemātiski simulētu žurkas meklējumus izejai no labirinta. . Protams, žurkas nebija, tas bija tikai dedukcijas un optimālā risinājuma atrašanas process. Šī automašīna bija daļa no Mārvina Minska doktora grāda.

adaline tīkls

Vēl viens interesants projekts neironu tīklu jomā bija ADALINE tīkls, ko 1960. gadā izstrādāja Bernards Virovs. Līdz ar to var uzdot jautājumu: tā kā pirms vairāk nekā pusgadsimta pētnieki zināja neironu tīklu teorētiskos pamatus un pat radīja pirmās šādu skaitļošanas ietvaru realizācijas, kāpēc bija nepieciešams tik ilgs laiks, līdz 21. gadsimtam, radīt reālus risinājumus, kuru pamatā ir neironu tīkli? Atbilde ir viena: nepietiekama skaitļošanas jauda, ​​taču tas nebija vienīgais šķērslis.

neironu tīklu

Lai gan 1950. un 1960. gados daudzi AI pionieri bija aizrāvušies ar neironu tīklu iespējām, un daži no viņiem paredzēja, ka līdz cilvēka smadzenēm ir tikai desmit gadi. Mūsdienās to ir pat smieklīgi lasīt, jo mēs joprojām neesam pat pietuvojušies cilvēka smadzeņu mašīnas ekvivalenta radīšanai, un mēs joprojām esam tālu no šī uzdevuma risināšanas. Ātri kļuva skaidrs, ka pirmo neironu tīklu loģika bija gan aizraujoša, gan ierobežota. Pirmās AI ieviešanas, izmantojot mākslīgos neironus un mašīnmācīšanās algoritmus, spēja atrisināt noteiktu šauru uzdevumu loku.

Taču, runājot par plašākām telpām un kaut kā patiesi nopietna risināšanu, piemēram, paraugu un attēlu atpazīšanu, sinhrono tulkošanu, runas un rokraksta atpazīšanu utt., proti, lietām, ko datori un mākslīgais intelekts jau spēj paveikt mūsdienās, izrādījās, ka pirmās neironu tīklu ieviešanas to vienkārši nespēja izdarīt. Kāpēc tas tā ir? Atbildi sniedza Mārvina Minska (jā, tas pats no SNARC) un Seimūra Papīra pētījumi, kuri 1969. gadā pierādīja perceptronu loģikas ierobežojumus un parādīja, ka vienkāršu neironu tīklu iespēju palielināšana tikai mērogošanas dēļ nedarbojas. Bija vēl viena, bet ļoti svarīga barjera – tobrīd pieejamā skaitļošanas jauda bija pārāk maza, lai neironu tīklus varētu izmantot kā paredzēts.

Interesanti arī:

- Reklāma -

Neironu tīklu renesanse

1970. un 1980. gados neironu tīkli tika praktiski aizmirsti. Tikai pagājušā gadsimta beigās pieejamā skaitļošanas jauda kļuva tik liela, ka cilvēki sāka pie tās atgriezties un attīstīt savas iespējas šajā jomā. Toreiz parādījās jaunas funkcijas un algoritmi, kas spēja pārvarēt pirmo vienkāršāko neironu tīklu ierobežojumus. Toreiz radās ideja par daudzslāņu neironu tīklu dziļu mašīnmācīšanos. Kas patiesībā notiek ar šiem slāņiem? Mūsdienās gandrīz visi noderīgie neironu tīkli, kas darbojas mūsu vidē, ir daudzslāņaini. Mums ir ievades slānis, kura uzdevums ir saņemt ievades datus un parametrus (svarus). Šo parametru skaits mainās atkarībā no tīkla risināmās skaitļošanas problēmas sarežģītības.

neironu tīklu

Turklāt mums ir tā sauktie "slēptie slāņi" - šeit notiek visa "maģija", kas saistīta ar dziļu mašīnmācīšanos. Tieši slēptie slāņi ir atbildīgi par šī neironu tīkla spēju mācīties un veikt nepieciešamos aprēķinus. Visbeidzot, pēdējais elements ir izejas slānis, tas ir, neironu tīkla slānis, kas dod vēlamo rezultātu, šajā gadījumā: atpazīts rokraksts, seja, balss, izveidots attēls, pamatojoties uz tekstuālo aprakstu, tomogrāfiskās analīzes rezultāts. diagnostikas attēls un daudz kas cits.

Lasi arī: Es pārbaudīju un intervēju Bing tērzēšanas robotu

Kā neironu tīkli mācās?

Kā jau zināms, atsevišķi neironi neironu tīklos apstrādā informāciju ar parametru (svaru) palīdzību, kuriem tiek piešķirtas individuālas vērtības un savienojumi. Šie svari mainās mācību procesā, kas ļauj pielāgot šī tīkla struktūru tā, lai tas radītu vēlamo rezultātu. Kā tieši tīkls mācās? Tas ir acīmredzams, tas ir pastāvīgi jātrenē. Nebrīnieties par šo teicienu. Mēs arī mācāmies, un šis process nav haotisks, bet, teiksim, sakārtots. Mēs to saucam par izglītību. Jebkurā gadījumā var apmācīt arī neironu tīklus, un tas parasti tiek darīts, izmantojot atbilstoši izvēlētu ievades komplektu, kas kaut kādā veidā sagatavo tīklu uzdevumiem, ko tas veiks turpmāk. Un tas viss atkārtojas soli pa solim, dažkārt mācību process zināmā mērā atgādina pašu apmācības procesu.

Piemēram, ja šī neironu tīkla uzdevums ir atpazīt sejas, tas ir iepriekš apmācīts lielam skaitam attēlu, kas satur sejas. Mācību procesā mainās slēpto slāņu svars un parametri. Eksperti šeit izmanto frāzi "izmaksu funkcijas minimizēšana". Izmaksu funkcija ir lielums, kas norāda, cik daudz konkrētais neironu tīkls pieļauj kļūdas. Jo vairāk mēs varam samazināt izmaksu funkciju apmācības rezultātā, jo labāk šis neironu tīkls darbosies reālajā pasaulē. Vissvarīgākā iezīme, kas atšķir jebkuru neironu tīklu no uzdevuma, kas ieprogrammēts, izmantojot klasisko algoritmu, ir tas, ka klasisko algoritmu gadījumā programmētājam soli pa solim ir jāizstrādā, kādas darbības programma veiks. Neironu tīklu gadījumā tīkls pats spēj iemācīties pareizi veikt uzdevumus. Un neviens precīzi nezina, kā sarežģīts neironu tīkls veic savus aprēķinus.

neironu tīklu

Mūsdienās neironu tīklus izmanto plaši un, iespējams, pārsteidzoši, ļoti bieži, nesaprotot, kā skaitļošanas process konkrētajā tīklā faktiski darbojas. Tas nav vajadzīgs. Programmētāji izmanto gatavus mašīnmācītos neironu tīklus, kas ir sagatavoti noteikta veida ievaddatiem, apstrādā tos sev vien zināmā veidā un rada vēlamo rezultātu. Programmētājam nav jāzina, kā secināšanas process darbojas neironu tīklā. Tas ir, cilvēks paliek malā no liela apjoma aprēķiniem, informācijas iegūšanas metodes un tās apstrādes ar neironu tīkliem. No kurienes zināmas cilvēces bailes par mākslīgā intelekta modeļiem. Mēs vienkārši baidāmies, ka kādu dienu neironu tīkls uzstādīs sev noteiktu uzdevumu un patstāvīgi, bez cilvēka palīdzības, atradīs veidus, kā to atrisināt. Tas satrauc cilvēci, izraisa bailes un neuzticību mašīnmācīšanās algoritmu izmantošanai.

tērzēšanas gpt

Šī utilitārā pieeja mūsdienās ir izplatīta. Pie mums ir tāpat: mēs zinām, kā kādu apmācīt konkrētā darbībā, un zinām, ka apmācības process būs efektīvs, ja tas tiks veikts pareizi. Cilvēks apgūs vēlamās prasmes. Bet vai mēs precīzi saprotam, kā viņa smadzenēs notiek dedukcijas process, kas izraisīja šo efektu? Mums nav ne jausmas.

Zinātnieku uzdevums ir pēc iespējas vairāk pētīt šīs problēmas, lai tās mums kalpotu un palīdzētu, kur nepieciešams, un, galvenais, nekļūtu par draudiem. Kā cilvēki mēs baidāmies no tā, ko nezinām.

Interesanti arī: 

Yuri Svitlyk
Yuri Svitlyk
Karpatu kalnu dēls, neatzīts matemātikas ģēnijs, "jurists"Microsoft, praktiskais altruists, kreisais-labais
- Reklāma -
Pierakstīties
Paziņot par
viesis

0 komentāri
Iegultās atsauksmes
Skatīt visus komentārus