Ang AI Ethics ay Lalo na Naiinis Sa AI Confinement Problem na Iyon, Kasama Ang Knotty Particular Para sa Pagkulong ng Autonomous Self-Driving Cars

Magagawa ba nating i-confine nang sapat ang AI kapag kailangan nating gawin ito?

makulit

Ang tanyag na ilusyonista at kinikilalang escape artist na si Harry Houdini ay minsang buong tapang na idineklara ang medyo hindi nahihiyang pahayag na ito: “Walang bilangguan ang makakahawak sa akin; walang kamay o paa na plantsa o bakal na kandado ang makakagapos sa akin. Walang mga lubid o tanikala ang makakapigil sa akin sa aking kalayaan."

Iyon ay tila isang medyo mataas na pagkakasunud-sunod. Sa pangkalahatan, lahat tayo ay sumasang-ayon na posibleng makulong ang isang tao na hindi sila makatakas. Ang lakas at katalinuhan ng tao ay maaari lamang pumunta sa malayo pagdating sa ilagay sa mahigpit na devised confinement. Kung ang isang bilangguan o kulungan ay stridently na itinayo na may ideya ng pagtakas-patunay, ito ay tila na walang tao ay maaaring pagtagumpayan tulad ng lahat-ng sumasaklaw na mga hadlang.

Siyempre, sa buong kasaysayan, may mga kapansin-pansing kaso ng pagtakas mula sa kung hindi man ay ipinapalagay na imposibleng makalabas sa mga pagkakulong. Sa pagbabalik sa taong 1244, nagawa ng isang bilanggo sa kilalang Tower of London na gumawa ng pansamantalang lubid sa pamamagitan ng paggamit ng mga punit-punit na bedsheet. Bahagyang nakatakas siya sa pamamagitan ng pag-akyat sa manipis na lubid. Naputol pala ang lubid sa gitna ng kanyang pagpupunyagi at agad siyang nahulog sa kanyang kamatayan.

Papayag ka bang sabihin na nakatakas siya?

Sa isang banda, sigurado, nagawa niyang makalabas ng confine room sa loob ng Tower of London. Ngunit ito ay parang hindi gaanong matagumpay na pagtakas dahil namatay siya sa akto ng pagsasagawa ng breakout. Ako ay maglakas-loob na sabihin na tayo ay magiging labis na bukas-palad sa pagtawag dito bilang isang pagtakas per se.

Marahil ay pamilyar ka sa nakatakas sa bilangguan na si William Sutton aka "Slick Willie" na isang kilalang-kilalang magnanakaw sa bangko noong 1930s at 1940s. Nagawa niyang makapasok sa listahan ng Ten Most Wanted Fugitives ng FBI. Sa kanyang iba't ibang pagkakakulong, nakahanap siya ng paraan upang makatakas nang maraming beses. Sa isang kaso, nagbihis siya bilang isang bantay ng bilangguan at nakalabas sa Philadelphia County Prison. Marahil ang mas dramatikong pagkakataon ay noong siya at ang isang dosenang iba pang kapwa convict ay gumamit ng lagusan upang lumabas sa Eastern State Penitentiary.

Naniniwala akong lahat tayo ay sasang-ayon na sa katunayan siya ay gumawa ng ilang tunay na pagtakas. Libre at malinaw. Sa huli, siya ay nahuli. Ito ay medyo nagpapahina sa bisa ng mga pagtakas kahit na hindi nito pinababa ang hindi maikakaila na katotohanang siya nga ay nakatakas. Tandaan na hindi lahat ng kanyang mga pagtatangka ay humantong sa isang pagtakas.

Ang pangatlong nakapagpapakitang halimbawa tungkol sa mga pagtakas ay ang kilalang pangyayari na kinasasangkutan ng maximum-security prison na Alcatraz o simpleng tinatawag na "The Rock" na ipinapalagay na hindi matatakasan na pagkakakulong na naninirahan sa gitna ng San Francisco Bay. Ang mataas na pinatibay na bilangguan na ito ay may maraming maingat na inilagay na mga tore ng bantay, ito ay may lubhang maselan na mga tuntunin tungkol sa kung ano ang maaaring gawin at hindi gawin ng mga bilanggo, at ang pangkalahatang hitsura ng pagiging ligtas ay pinatindi ng aspeto na ang mabagsik at hindi mapagpatawad na malamig na tubig ng Karagatang Pasipiko ay napaliligiran. itong parang kuta.

Noong Hunyo 12, 1962, natuklasan ang isang nakakagulat at nakakagawa ng kasaysayan na pagtakas. Tatlong bilanggo ang wala sa kanilang mga itinalagang selda. Ang mga pekeng dummy na ulo ay nakapatong sa kani-kanilang mga unan, na niloloko ang mga guwardiya na buong magdamag ay nagpapatrolya sa mga pasilyo sa harap ng mga selda. Sa pagkakaalam namin, ang mga bilanggo ay gumawa ng isang paraan upang gumamit ng baras ng bentilador ng bilangguan upang makaakyat sa bubong ng bilangguan, pagkatapos ay umakyat sila at tumawid sa isang bakod, upang maabot nila ang gilid ng isla. Pagkatapos ay tila naglunsad sila ng balsa na hindi nila ginawa mula sa mga kapote.

Hindi pa rin alam ang kanilang kinaroroonan. Maaaring namatay sila sa matubig na paglalakbay. Maaaring nabuhay sila at nakarating sa pampang at kalayaan. Sila o ang kanilang mga katawan ay natagpuan kailanman. Isinara ng FBI ang kaso noong 1979 at ibinigay ito sa US Marshalls Service. Ipinapalagay ng isa na hindi talaga natin malalaman kung ano ang kinalabasan.

Ano ang sinasabi sa amin ng lahat ng mga alamat na ito tungkol sa pagtakas mula sa pagkakulong?

Mukhang medyo malinaw na:

Minsan hindi posible ang pagtakas
Minsan ang pagtakas ay posible ngunit nahuhulog sa panahon ng pagtatangkang tumakas
Minsan posible ang pagtakas ngunit panandalian lang
Minsan ang pagtakas ay posible at tila walang hanggan

Inilabas ko ang nakakaintriga na paksang ito dahil sa isang bagay na seryosong pinag-uusapan sa larangan ng Artificial Intelligence (AI). May matagal nang tanong tungkol sa kung ang AI ay maaaring makulong o makulong sa antas na ang AI ay hindi makatakas o makawala mula sa nasabing pagkakulong.

Ito ay karaniwang tinutukoy bilang ang AI Confinement Problem (AICP).

Karaniwang sinasabi ng mga tagaloob AICP sa iba pang mga insider, ginagawa ito nang may kindat-wink na pagkilala sa insider acronym. Ang isa pang pinaikling lingo ay ang pagbigkas lamang ng salitang "kulong" o ang salitang "kulong" upang ilabas ang paksa. Piliin ang alinmang gusto mo.

Ang pinakabuod ng paksa ay ang taimtim at taos-pusong paniniwala na maaaring kailanganin nating ikulong ang AI, bagama't sabay-sabay nitong itinataas ang matitinik na tanong kung maaari ba tayong makalikha ng makatotohanang pagkakulong na magiging tunay na makulong at hindi maiiwasan. Hindi lamang sa teorya ngunit aktwal na pang-araw-araw na pagsasanay. Ang AI ay hindi kinakailangang isang pushover. Marahil ay makakahanap ang AI ng isang paraan upang lumabas, mag-bust out, mag-jailbreak, magpalipad sa kulungan, o kung hindi man ay kumawag-kawag o elektronikong lumabas sa pagkakakulong. Isa itong seryoso at malungkot na bukas na isyu na patuloy na pinaglalabanan ng AI Ethics at Ethical AI, tingnan ang aking patuloy at malawak na saklaw ng AI Ethics at Ethical AI sa ang link dito at ang link dito, Lamang upang pangalanan ang ilang.

Sinabi ni Houdini na walang kulungan ang maaaring humawak sa kanya at walang kadena ang makakagapos sa kanya.

Marahil ay maaaring gawin ng AI ang parehong mapangahas na pag-angkin, na ginagawa ito nang walang anumang hyperbole o labis na pahayag.

Oras na para i-unpack ito.

Maaari kang matukso na agad na maniwala na ang AI ay maaaring maging isang escape artist habang naniniwala na ang mga tao ay mas malamang na makatakas mula sa isang mahigpit na natukoy na estado ng pagkakulong. Ang mga tao ay tao. Ang paggawa ng pagkakulong para sa mga tao sa pangkalahatan ay dapat na diretso. Ang lansihin ay walang alinlangan na ang pagpapanatiling buhay ng tao sa panahon ng kanilang pagkakulong ay nangangahulugan na ang isang bagay ay dapat ayusin upang bigyang-daan ang pagbibigay ng pagkain, pagpapagana ng pangangalagang may kaugnayan sa kalusugan, at mga katulad na nauugnay sa gumaganang katawan ng tao. Ang mga detalyeng iyon ay tiyak na mag-iiwan ng mga bukas na dulo at mga pagkakataon para sa paghahanap ng paraan upang makatakas mula sa pagkakulong.

Ang isang AI system ay malamang na hindi nangangailangan ng mga parehong humanitarian na probisyon (well, tulad ng makikita mo sa isang sandali, ito ay depende sa kung isasaalang-alang namin ang sentient AI at ang mga parameter na nauugnay sa legal na pagkatao). Kung ang isang AI ay isang robot, maaari lamang nating itapon ang kagamitan sa isang espesyal na escape-proof na cell at hindi na babalik upang makita ang mga kinakalawang na bahagi nito. Ang gawa ay tapos na. Huwag mag-alala tungkol sa pisikal na kakayahang makatakas.

Ang AI bagaman maaaring pangunahin ay software at ergo ay tumatakbo sa lahat ng paraan ng mga computer system. Sa kasong iyon, ang pagkakulong ay nagiging mas mahirap. Sa pag-aakala na kahit papaano ay maaari naming i-round up ang lahat ng mga kopya, maaari naming mailagay ang nakakasakit na AI sa isang tapat na computer na espesyal naming ginawa upang mabilanggo para sa AI. Ang espesyal na layunin na computer na ito ay gumaganap bilang isang uri ng AI confinement citadel. Marahil ito ay naglalaman lamang ng isang partikular na AI o maaaring matalinong itatag upang maging isang AI holding tank para sa lahat ng uri ng AI system (isipin ang isang bagay tulad ng detalyadong entrapment system na ginagamit sa pelikula Ghostbusters, bilang isang ilustrasyon nitong tinatanggap na medyo malayong ideya).

Bago ako pumasok sa mga detalye ng AI Confinement Problem, sulit na isipin ang larangan ng AI bilang binubuo ng dalawang kundisyon o posibilidad. Pinag-uusapan ko ang pagkakaiba sa pagitan ng AI na nararamdaman at AI na hindi nararamdaman. Kailangan nating tiyakin na tayo ay nasa parehong pahina tungkol sa mga pagkakaibang ito upang higit pang matalakay ang usapin ng AI Confinement.

Nag-aalok ako sa susunod ng isang matigas at walang kabuluhang pangungusap na maaaring makita mong nakakagulat o lubos na halata at makamundong.

Walang anumang AI ngayon na nakakaramdam.

Wala kaming sentient AI. Hindi namin alam kung magiging posible ang sentient AI. Walang sinuman ang maaaring mahuhulaan kung makakamit natin ang sentient AI, o kung ang sentient AI ay kahit papaano ay miraculously kusang lalabas sa isang anyo ng computational cognitive supernova (karaniwang tinutukoy bilang ang singularity, tingnan ang aking coverage sa ang link dito). Para sa inyo na seryosong nakikisawsaw sa larangan ng AI, wala sa mga nabanggit na pahayag na ito ang nakakagulat o nakakapagtaas ng anumang kilay. Samantala, may mga napakalaking headline at labis na pagpapaganda na maaaring malito sa mga tao sa pag-aakala na mayroon tayong sentient AI o na tayo ay nasa nalalapit na punto ng pagkakaroon ng sentient AI sa anumang darating na araw.

Mangyaring mapagtanto na ang AI ngayon ay hindi nagagawang "mag-isip" sa anumang paraan na katumbas ng pag-iisip ng tao. Kapag nakipag-ugnayan ka kay Alexa o Siri, ang mga kakayahan sa pakikipag-usap ay maaaring mukhang katulad ng mga kapasidad ng tao, ngunit ang katotohanan ay ito ay computational at walang katalinuhan ng tao. Ang pinakabagong panahon ng AI ay gumawa ng malawakang paggamit ng Machine Learning (ML) at Deep Learning (DL), na gumagamit ng computational pattern matching. Ito ay humantong sa mga AI system na may hitsura ng mga proclivities na tulad ng tao. Samantala, walang anumang AI ngayon na may kamukha ng sentido komun at wala ring anumang nakakaisip na pagtataka ng matatag na pag-iisip ng tao.

Ang ML/DL ay isang paraan lamang ng computational pattern matching. Ang karaniwang diskarte ay ang mag-ipon ka ng data tungkol sa isang gawain sa paggawa ng desisyon. Ipapakain mo ang data sa mga modelo ng ML/DL computer. Ang mga modelong iyon ay naghahanap ng mga pattern ng matematika. Matapos mahanap ang gayong mga pattern, kung ito ay natagpuan, gagamitin ng AI system ang mga pattern na iyon kapag nakatagpo ng bagong data. Sa pagtatanghal ng bagong data, ang mga pattern na batay sa "luma" o makasaysayang data ay inilapat upang mag-render ng kasalukuyang desisyon.

Ang AI at lalo na ang laganap na pagdating ng ML/DL ay nakakuha ng kaguluhan sa lipunan tungkol sa mga etikal na batayan kung paano maaaring mabuo ang AI. Maaaring alam mo na noong nagsimula itong pinakabagong panahon ng AI, nagkaroon ng malaking pagsabog ng sigasig para sa tinatawag ngayon ng ilan. AI For Good. Sa kasamaang palad, sa mga takong ng bumubulusok na kaguluhan na iyon, nagsimula kaming masaksihan AI Para sa Masama. Halimbawa, ang iba't ibang mga sistema ng pagkilala sa mukha na nakabatay sa AI ay ipinakita bilang naglalaman ng mga pagkiling sa lahi at mga bias ng kasarian, na tinalakay ko sa ang link dito.

Mga pagsisikap na lumaban AI Para sa Masama ay aktibong isinasagawa. Bukod sa mapusok na legal na mga hangarin sa pagpigil sa maling gawain, mayroon ding malaking pagtulak patungo sa pagtanggap sa AI Ethics upang ituwid ang pagiging masama ng AI. Ang paniwala ay dapat nating gamitin at i-endorso ang mga pangunahing prinsipyo ng Etikal na AI para sa pagbuo at paglalagay ng AI na ginagawa ito upang mabawasan ang AI Para sa Masama at sabay na nagbabadya at nagtataguyod ng mas kanais-nais AI For Good.

Paano ito malamang na lumitaw sa kaso ng paggamit ng Machine Learning?

Sa totoo lang, kung ang mga tao ay dati nang gumagawa ng mga pattern na desisyon na nagsasama ng mga hindi kanais-nais na pagkiling, malamang na ang data na ginamit upang "sanayin" ang ML/DL ay nagpapakita nito sa banayad ngunit makabuluhang mga paraan. Ang Machine Learning o Deep Learning computational pattern matching ay bulag na susubukan na mathematically gayahin ang data nang naaayon. Walang pagkakahawig ng sentido komun o iba pang nakikitang aspeto ng AI-crafted modeling per se.

Higit pa rito, maaaring hindi napagtanto ng mga developer ng AI kung ano ang nangyayari. Ang arcane mathematics sa ML/DL ay maaaring magpahirap sa pag-iwas sa mga nakatagong bias ngayon. Nararapat kang umasa at aasahan na ang mga developer ng AI ay susubok para sa mga potensyal na nakabaon na bias, kahit na ito ay mas nakakalito kaysa sa tila. Mayroong matatag na pagkakataon na kahit na may medyo malawak na pagsubok na magkakaroon pa rin ng mga bias na naka-embed sa loob ng mga pattern na tumutugma sa mga modelo ng ML/DL.

Medyo maaari mong gamitin ang sikat o kasumpa-sumpa na kasabihan ng garbage-in garbage-out (GIGO). Ang bagay ay, ito ay mas katulad sa mga biases-in na insidiously makakuha infused bilang biases lumubog sa loob ng AI. Ang algorithm na paggawa ng desisyon (ADM) ng AI ay axiomatically nagiging puno ng hindi pagkakapantay-pantay.

Hindi maganda.

Ito rin ang dahilan kung bakit ang mga prinsipyo ng AI Ethics ay umusbong bilang isang mahalagang pundasyon para sa mga gumagawa, naglalagay, o gumagamit ng AI. Dapat nating asahan na yakapin ng mga gumagawa ng AI ang AI Ethics at maghangad na makagawa ng Ethical AI. Gayundin, ang lipunan ay dapat na magbantay na ang anumang AI na inilabas o na-promote sa paggamit ay sumusunod sa mga alituntunin ng AI Ethics.

Upang makatulong na mailarawan ang mga alituntunin sa AI Ethics, isaalang-alang ang set gaya ng isinaad ng Vatican sa Panawagan ng Roma Para sa Etika ng AI at na tinakpan ko ng malalim ang link dito. Isinasaad nito ang anim na pangunahing prinsipyo ng etika ng AI:

Transparency: Sa prinsipyo, ang mga AI system ay dapat na maipaliwanag
Pagsasama: Ang mga pangangailangan ng lahat ng tao ay dapat isaalang-alang upang ang lahat ay makinabang, at ang lahat ng indibidwal ay maihandog ang pinakamahusay na posibleng mga kondisyon upang ipahayag ang kanilang sarili at umunlad.
Responsibilidad: Ang mga nagdidisenyo at nagde-deploy ng paggamit ng AI ay dapat magpatuloy nang may pananagutan at transparency
Pagkakaiba-iba: Huwag lumikha o kumilos ayon sa pagkiling, kaya pinangangalagaan ang pagiging patas at dignidad ng tao
Kahusayan: Dapat na gumana nang mapagkakatiwalaan ang mga AI system
Seguridad at privacy: Dapat gumana nang ligtas ang mga AI system at igalang ang privacy ng mga user.

Gaya ng sinabi ng US Department of Defense (DoD) sa kanilang Mga Etikal na Prinsipyo Para sa Paggamit ng Artipisyal na Katalinuhan at gaya ng tinakpan ko ng malalim sa ang link dito, ito ang kanilang anim na pangunahing prinsipyo sa etika ng AI:

Responsable: Ang mga tauhan ng DoD ay gagamit ng mga naaangkop na antas ng paghatol at pangangalaga habang nananatiling responsable para sa pagbuo, pag-deploy, at paggamit ng mga kakayahan ng AI.
Pantay-pantay: Magsasagawa ang Departamento ng mga sadyang hakbang upang mabawasan ang hindi sinasadyang pagkiling sa mga kakayahan ng AI.
Nasusubaybayan: Ang mga kakayahan sa AI ng Departamento ay bubuo at ipapakalat upang ang mga nauugnay na tauhan ay nagtataglay ng naaangkop na pag-unawa sa teknolohiya, mga proseso ng pag-unlad, at mga pamamaraan ng pagpapatakbo na naaangkop sa mga kakayahan ng AI, kabilang ang mga transparent at naa-audit na pamamaraan, pinagmumulan ng data, at pamamaraan at dokumentasyon ng disenyo.
reliable: Ang mga kakayahan ng AI ng Departamento ay magkakaroon ng tahasan, mahusay na tinukoy na mga paggamit, at ang kaligtasan, seguridad, at pagiging epektibo ng mga naturang kakayahan ay sasailalim sa pagsubok at katiyakan sa loob ng mga tinukoy na paggamit sa kanilang buong lifecycle.
Mapapamahalaan: Ang Departamento ay magdidisenyo at mag-iinhinyero ng mga kakayahan ng AI upang matupad ang kanilang mga nilalayon na pag-andar habang nagtataglay ng kakayahang makita at maiwasan ang mga hindi sinasadyang kahihinatnan, at ang kakayahang alisin o i-deactivate ang mga naka-deploy na system na nagpapakita ng hindi sinasadyang pag-uugali.

Tinalakay ko rin ang iba't ibang mga kolektibong pagsusuri ng mga prinsipyo ng etika ng AI, kabilang ang pagsaklaw sa isang set na ginawa ng mga mananaliksik na nagsuri at nagkondensasyon sa kakanyahan ng maraming pambansa at internasyonal na mga alituntunin sa etika ng AI sa isang papel na pinamagatang "The Global Landscape Of AI Ethics Guidelines" (nai-publish sa Kalikasan), at tinutuklasan ng aking saklaw sa ang link dito, na humantong sa listahan ng keystone na ito:

Aninaw
Katarungan at Pagkamakatarungan
Non-Maleficence
Pananagutan
Privacy
Pagkabenta
Kalayaan at Autonomy
Pagkatiwalaan
Pagpapanatili
Dignidad
Pagkakaisa

Tulad ng maaari mong direktang hulaan, ang pagsisikap na i-pin down ang mga detalye na pinagbabatayan ng mga prinsipyong ito ay maaaring maging lubhang mahirap gawin. Higit pa rito, ang pagsisikap na gawing isang bagay na ganap na nahahawakan at sapat na detalyadong magagamit kapag gumagawa ng mga AI system ay mahirap ding basagin. Madaling gawin sa pangkalahatan ang ilang handwaving tungkol sa kung ano ang mga alituntunin ng AI Ethics at kung paano dapat itong sundin sa pangkalahatan, habang ito ay isang mas kumplikadong sitwasyon sa AI coding na kailangang maging ang tunay na goma na nakakatugon sa kalsada.

Ang mga prinsipyo ng AI Ethics ay dapat gamitin ng mga developer ng AI, kasama ang mga namamahala sa mga pagsusumikap sa pagpapaunlad ng AI, at maging ang mga sa huli ay naglalagay at nagsasagawa ng pangangalaga sa mga AI system. Ang lahat ng mga stakeholder sa buong AI life cycle ng pag-unlad at paggamit ay isinasaalang-alang sa loob ng saklaw ng pagsunod sa mga itinatag na pamantayan ng Ethical AI. Ito ay isang mahalagang highlight dahil ang karaniwang pagpapalagay ay ang "mga coder lamang" o ang mga nagprograma sa AI ay napapailalim sa pagsunod sa mga paniwala sa AI Ethics. Gaya ng naunang sinabi, kailangan ng isang nayon upang makabuo at maglagay ng AI, at kung saan ang buong nayon ay dapat sanay at sumunod sa mga tuntunin ng AI Ethics.

Ang sabi ng lahat, ginagamit natin ngayon ang non-sentient AI at balang araw ay maaaring magkaroon tayo ng sentient AI (ngunit iyon ay puro haka-haka). Ang parehong uri ng AI ay malinaw na may pag-aalala para sa AI Ethics at kailangan nating tumuon sa Ethical AI kahit gaano pa ito binubuo.

Ibinabalik ang paksa ng AI Confinement, may kapansin-pansing kaibahan sa pagitan ng likas na katangian ng "pagkakulong" na nangangailangan ng non-sentient AI versus sentient AI.

Sa kaso ng pagkakulong na nauugnay sa sentient AI, maaari tayong maglaro ng laro ng paghula ng halos walang katapusang mga uri. Marahil ang nararamdamang AI ay magiging tulad ng mga tao at magpapakita ng katulad na kakayahan sa pag-iisip. O maaari nating ipagpalagay na ang sentient AI ay magiging higit sa tao at lalampas sa ating mga anyo ng pag-iisip. Ang sukdulang sa sentient AI ay tila super-intelligence, isang bagay na maaaring napakatalino at tuso na hindi natin maisip ngayon ang napakalawak na kahusayan sa pag-iisip. Iminumungkahi ng ilan na ang ating isipan ay magiging maliit kung ihahambing. Ang super-duper AI na ito ay tatakbo sa paligid natin sa paraang maihahambing sa kung paano natin maiisip ngayon ang mga ants o caterpillar.

Gusto kong ilarawan ang AI Confinement Problem na binubuo ng dalawang mahalaga at medyo kontrobersyal na pagtatalo:

Kontrobersyal na Pagtatalo #1: Ito ay diumano'y imposibleng matagumpay na makulong ang nararamdamang AI.
Kontrobersyal na Pagtatalo #2: Imposible raw na makatakas ang non-sentient AI mula sa ating pagkakakulong.

Sa madaling salita, ang unang nakalistang umiiral na assertion ay ang sentient AI ay magiging mapagkunwari na anuman ang paraan ng pagkakulong na gagawin natin at gaano man tayo nagsisikap, ang AI ay makakatakas. Ang mga tao ay hindi matagumpay na maikukulong ang nararamdamang AI. Ang lohika na bahagyang pinagbabatayan ng pagtatalo na iyon ay ang AI ay palaging magagawang lampasan ang mga tao, kaya ang ginawa ng tao na pagkakulong ay malalampasan ng isang nakakaramdam na AI. Ang isang caveat na malungkot na kasama nito ay iyon antas ng tao Ang sentient AI ay maaaring hindi sapat na matalino upang lumabas, ngunit iyon ang higit na tao or sobrang talino gagawin ng AI.

Tandaan din na kapag tinutukoy ko ang pagiging makatakas, nauna kaming napagkasunduan na mayroong ilang mga variant na nauugnay sa pagtakas. May pagtakas na humahantong sa kabiguan sa panahon ng pagtatangka, at may mga pagkakaiba-iba ng pagtakas na mas matagumpay ngunit humahantong sa panandalian laban sa matagal na o walang hanggang kalayaan. Dapat nating ilapat ang parehong mga parameter sa AI Confinement Problem.

Ang isang AI ay maaaring pansamantalang makatakas at marahil ay agad na mahuli at muling mabilanggo. O maaaring lumabas ang isang AI at sa kalaunan ay matagpuan at makulong muli. Mayroon ding posibilidad na ang AI ay makatakas, mananatiling libre, at hindi na namin ito maikukulong muli. Nagtitiwala ako na maaari mong isipin ang lahat ng gayong mga posibilidad.

Higit pa rito, kailangan nating mag-ingat at huwag ituring ang AI bilang isang uri ng monolith. Kapag tinutukoy ng mga tao ang AI, minsan ay ginagamit nila ang parirala sa paraang sumasaklaw sa kategorya. Ang posibilidad ay ang AI ay malamang na magiging mas unti-unti at hindi isang dambuhalang AI overlord (na siyang karaniwang paglalarawan). Hindi ko sinasabi na ang futuristic na AI ay hindi kailanman maaaring pagsama-samahin at pagsasama-sama sa isang bagay, at sa halip ay itinuturo lamang na ito ay hindi lilitaw sa axiomatically.

Ipagpalagay natin para sa kapakanan ng talakayan na maraming magkakaibang mga AI system at kapag pinag-iisipan natin ang pagkulong ng AI, nakatuon tayo sa isang partikular o isang partikular na hanay ng mga AI. Siyempre, gaya ng nasabi na, dahil sa ngayon ay pinag-uusapan natin ang tungkol sa sentient AI, lahat ng taya ay hindi na dahil maaari kang gumawa ng maraming pagpapalagay hangga't maaari tungkol sa hindi alam at umiiral na AI na ito sa nilalaman ng iyong puso.

Isang mabilis na twist para sa iyo.

Ipagpalagay na ito ang kaso na ang superhuman o super-intelligent na AI ay maaaring dayain tayo, mga tao. Ipagpalagay pa na ang ating ginawang pagkakulong ay kulang dahil ito ay idinisenyo at itinayo batay sa katalinuhan ng tao (Hindi ako sumasang-ayon sa mga pagpapalagay na ito, binabanggit lamang ang mga ito). Tinatanong ko ito sa iyo, bakit hindi natin subukang gumamit ng superhuman o super-intelligent na sentient AI para tumulong sa pagkakaroon ng mas magandang pagkakulong? Ang karaniwang sagot ay ang lahat ng nadama na AI ay magiging kasabwat at hindi makakatulong sa aming paghahanap. O kaya'y ang AI na hiwalay sa iba pang AI ay nag-aalala na sa wakas ay ibaling natin ang pagkakulong sa AI na tumulong sa ating human-plus-AI na ginawang escape-proof na pagkakulong. Tiyak na hindi namin aasahan na ang isang superhuman o super-intelligent na AI ay magiging sapat na pipi upang gumawa ng pagkakulong na posibleng magamit bilang isang bitag laban sa sarili nito.

Paikot ikot yan.

Ang pangalawang nakalistang kontrobersyal na pagtatalo ay hindi makakatakas ang non-sentient AI mula sa anumang pagkakakulong na itinakda namin para sa naturang AI. Nakikita mo, ang lohika ay hindi sapat ang kakayahan ng non-sentient AI na talagang dayain ang mga tao. Ang mga tao ay palaging nauuna kahit isang hakbang o higit pa kaysa sa hindi nakakaramdam na AI. Ang anumang kulungan na aming idinisenyo at itatayo ay magiging escape-proof. Ang AI ay mahuhuli at haharapin ang isang "habang buhay" sa likod ng mga bar.

Hindi ako pumayag sa paniwalang iyon, sa ilang kadahilanan.

Nasaksihan namin ang mga cybercrook na matalinong gumawa ng mga virus sa computer na patuloy na lumalabas. Ang aming mga pagsusumikap ay pangunahin tungkol sa pagharang sa virus ng computer sa halip na sa anumang paraan ay makuha at ikulong ito. Ang mga taong gumagawa ng non-sentient AI ay malamang na makakahanap ng mga paraan para i-code ang AI na magiging lubhang mahirap panatilihing nakakulong.

Bilang karagdagan, ang mga tao ay maaaring gumawa ng AI na nag-aayos sa sarili o nagpapabago sa sarili. Maaaring alam ng mga mambabasa ang aking patuloy na mga talakayan na sumasaklaw sa AI-infused polymorphic computer virus. Ang mga ito ay mga virus ng computer na nagbabago ng hugis na palihim na ginawa upang subukan at hindi matukoy, o na kapag natukoy ay mabilis na maghugis muli upang maiwasan ang karagdagang pagtuklas.

May mga katulad na ML/DL system na sadyang naglalayong mag-adjust sa sarili o magbago sa sarili, na nagbibigay-daan para sa AI system na sana ay umunlad nang mag-isa habang ito ay ginagamit. Bagaman ito ay maaaring maging problema dahil ang AI ay maaaring magbago sa isang paraan na hindi na kanais-nais at pagkatapos ay kumilos sa mga nakakagambalang paraan, tingnan ang link dito.

Ang isa pang anggulo ay maaaring gamitin ng mga tao ang kanilang mga tool na nakabatay sa computer, gaya ng non-sentient AI, upang makagawa ng AI confinement. Sa ganoong kahulugan, ang premise na ang mga tao ay nakakapag-isip lamang sa ilang limitadong antas ay potensyal na isang pagkukunwari. Maaari naming dagdagan ang aming mga proseso ng pag-iisip sa pamamagitan ng tulad ng non-sentient AI at samakatuwid ay makahanap ng mga bagong paraan upang magdisenyo at bumuo ng sapat na confinement para sa non-sentient AI.

Sinabi ng lahat, pinuputol ko ang dalawang kontrobersyal na mga pagtatalo tungkol sa AI Confinement at nangangatwiran na hindi kami makakagawa ng anumang hindi masasagot na mga paghahabol. Hindi namin alam kung tiyak na maaari naming palaging at walang pagkukulang na ikulong ang non-sentient AI. Hindi natin tiyak na makakatakas sa ating pagkakakulong ang sentient AI ng anumang kalibre, kabilang ang superhuman at super-intelligent.

Ang magandang balita ay ang buong kit at kaboodle ay isang kalokohan na dapat isaalang-alang. medyo bastos kong sabi. Kung masusumpungan natin ang ating sarili na nasa ilalim ng pagbabanta ng isang hindi nakakaramdam na AI, matino at masipag nating gustong tiyakin kung maaari ba natin itong ikulong. Gayundin, kung tayo ay nasa ilalim ng pagbabanta ng isang nakakaramdam na AI ng anumang kalibre, gugustuhin nating matukoy kung maaari ba nating ikulong ito.

Ang Problema sa Pagkakulong ng AI ay isang karapat-dapat na palaisipan at lubhang kapaki-pakinabang upang malaman.

Sa palagay ko ay maaaring nagkakaroon ka ng matinding pananakit tungkol sa isang mahalagang bahagi ng usapin ng AI Confinement. Ang lahat ng pag-uusap na ito tungkol sa pagkakulong ay tila hangal o walang katuturan dahil tinutukoy natin ang AI kaysa sa isang taong nakakulong. Ang malinaw na bagay na dapat gawin ay ang paghipan lamang ng AI sa magkapira-piraso. Wasakin ang anumang AI na hindi natin gusto at pinaniniwalaan na dapat i-confine. Kalimutan ang tungkol sa lahat ng mga contortion na ito na nauugnay sa pagkakulong at squash lang ang AI na parang isang bug. Mukhang ito ang pinakamahusay na solusyon kung saan hindi mo na kailangang magdisenyo at bumuo ng mga kulungan, sa halip ay gugulin ang iyong lakas sa pagpuksa sa AI na napagpasyahan nating mga tao na hindi karapat-dapat o mapanganib.

Napakadali.

Lumalabas na mayroong isang serye ng mga lohikal na sagot na maaaring gusto mong pag-isipan.

Una, kung ang AI ay nakakaramdam, posibleng handa tayong pahiran ang naturang AI ng isang anyo ng legal na katauhan, tingnan ang aking pagsusuri sa ang link dito. Ang konsepto ay magbibigay kami ng AI na may pagkakahawig ng mga karapatang pantao. Baka hindi verbatim. Marahil isang espesyal na hanay ng mga karapatan. Sino ang nakakaalam? Sa anumang kaso, maaari mong isipin ang tila kakaibang paniwala na hindi natin basta-basta mapapawi ang nararamdamang AI. Maaaring may itinakda na legal na proseso na kasangkot. Kabilang dito ang hindi natin kinakailangang ipatupad ang "parusang kamatayan" sa isang nakakaramdam na AI (whoa, maghintay lang hanggang tayo bilang isang lipunan ay masangkot sa ganoong uri ng debate sa lipunan). Ang diwa ay maaaring kailanganin natin ang isang angkop na anyo ng AI confinement bilang kapalit o habang nagpapasya kung sisirain ang isang nakakaramdam na AI.

Pangalawa, maaari tayong makakita ng kapaki-pakinabang na halaga sa isang AI na gusto nating panatilihing buo at hindi lubos na sirain o tanggalin. Ipagpalagay na gumawa kami ng isang non-sentient AI na humahantong sa amin tungo sa pagpapagaling ng cancer. Gusto ba naming tanggalin ang ganoong AI? Halos hindi ko iniisip. Ipagpalagay na umiral ang isang ganap na superhuman AI na nangakong lulutasin ang gutom sa mundo. Aalisin ba natin itong promising sentient AI, na ginagawa ito nang hindi muna nireresolba ang pandaigdigang gutom? Dapat nating pag-isipang mabuti iyon.

Ang punto ay maaari tayong magkaroon ng iba't ibang mga bona fide na dahilan upang panatilihing buo ang AI. Sa halip na tanggalin ito o i-scrambling, maaari naming hilingin na tiyakin na ang AI ay mananatiling buo. Papayagan ang AI na gawin ang ilan sa mga aksyon nito sa limitadong paraan. Gusto naming gamitin ang anumang magagawa ng AI para sa amin.

Paano natin makukuha ang ating cake at kakainin din ito?

Sagot: Pagkakulong sa AI.

Sa buong talakayang ito, binanggit ko ang isang uri ng paghahambing sa pagitan ng pagkakulong ng tao at pagkakulong ng AI. Upang ituwid ang rekord, sa pangkalahatan ay tutol ako sa anthropomorphizing AI. Sasabihin ko ang higit pa tungkol dito sandali. Ang dahilan kung bakit ko dinadala ang pagkabalisa ngayon ay na hindi ko nais na magmungkahi o magpahiwatig na ang hindi-sentient AI ngayon ay kahalintulad sa mga tao at sangkatauhan. Napakarami na ng ganoong uri ng mali at mapanlinlang na paghahambing na nangyayari. Ipagpaumanhin ang aking paghahambing na paggamit na ginawa ko sa isang sana'y maingat at maingat na paraan.

Ang pagsisikap na malaman kung paano i-confine ang AI ay isang kawili-wili at napakaraming kapaki-pakinabang na panukala.

Kahit na wala tayong AI ngayon na nagpapakita ng agarang pangangailangan para sa pagkakulong, ang usapin ay nagbibigay ng maraming hamon na maaaring makatulong sa pagsulong ng ating pang-unawa sa cybersecurity. Alam ng langit na kailangan nating magpatuloy sa pag-truck pagdating sa pagpapalakas ng mga proteksyon sa cyber sa lahat ng sinabi. Ang paghahangad ng cybersecurity para sa pagkulong sa AI ay malamang na matuklasan ang maraming kapaki-pakinabang na side benefits na nalalapat sa pagtagumpayan ng mga taong gumagawa ng masama na gumagamit ng computing para sa maling gawain, kasama ang pagharap sa mga nakapipinsala at patuloy na lumalawak na mga virus ng computer.

Ang mga naghahangad na murahin ang dating pagtugis sa AI Confinement Problem ay nawawala ang mas malaking larawan. Para sa kanila, nakikita lang nila ito bilang isang napakalayo at malayong isyu para sa balang araw na malayong posibilidad na naglalaman ng superhuman AI o super-intelligent AI. Sa halip ay dapat mong bigyang-kahulugan ito bilang isang madaling gamiting paraan para sa pagsusulong ng cybersecurity, na ganap na naaangkop sa mundo ngayon, at para sa pagiging handa na harapin ang marahil sa lalong madaling panahon na hindi nakakaramdam ng AI na maaaring gusto nating i-confine (kasama ang paghahanda para sa posibleng mapaminsalang panganib ng isang kasuklam-suklam na sentient AI, sa kabila ng tila mababang pagkakataon na makatagpo natin ang naturang AI).

Mas mahusay na maging ligtas kaysa humihingi ng paumanhin.

Ang isang kamakailang pagsusuri sa pananaliksik tungkol sa AI Confinement Problem ay naglagay ng indikasyon na ito ng kasalukuyang katayuan: “Ang AI confinement ay isang mahirap na problema sa maraming iminungkahing hakbang upang mapabuti ang seguridad ngunit walang mga garantiya tungkol sa kaligtasan. Gayunpaman, ang aming kasalukuyang AI ay maaaring hindi sumusubok na makatakas o walang kakayahang lumabas sa mga simulation. Mayroong ilang mga halimbawa ng real-world AI na sumisira sa isang layer ng pagkakulong, ngunit wala ni isa na naghahatid ng anumang panganib sa mga tao o ang kakayahang magtatag ng patuloy na presensya sa mga malalayong computer” (Pilosopiya journal, "Pag-unawa at Pag-iwas sa Mga Pagkabigo ng AI: Isang Praktikal na Gabay" ni Robert Williams at Roman Yampolskiy).

Ang parehong mga mananaliksik ay naglalarawan din ng isang serye ng mga antas ng potensyal na pagtakas:

Antas 0 ng Potensyal na Pagtakas: Wala para sa maginoo na software
Antas 1 ng Potensyal na Pagtakas: Maaaring makakita ang ahente ng mga hindi inaasahang pag-uugali na teknikal na nakakamit ang layunin ngunit hindi kanais-nais, tulad ng mga genetic algorithm
Antas 2 ng Potensyal na Pagtakas: Sinadya ng ahente na i-hack ang kapaligiran nito, gaya ng mga advanced na reinforcement learners
Potensyal na Pagtakas Antas 3 (panganib): Ang ahente ay may kakayahan at drive na masira ang karamihan sa cybersecurity at mga pamamaraan ng containment, gaya ng Artificial General Intelligence (AGI)

Isang paliwanag ang ibinibigay tungkol sa mga antas ng potensyal na pagtakas na ito: “Sa antas 0, walang kinakailangang pagkulong na lampas sa karaniwang mga hakbang sa cybersecurity na naaangkop para sa kapaligiran ng pag-deploy. Sa antas 1 at 2, may maliit na panganib ng pagalit na pagtakas, ngunit ang ahente ay dapat na subaybayan nang mabuti para sa hindi kanais-nais na pag-uugali at mga pagsasamantala sa software. Ang pamamahagi ng paglipat mula sa simulator patungo sa totoong mundo ay nagbibigay ng hadlang laban sa makitid na AI na nakakaapekto sa totoong mundo. Dahil dito, ang mga ahente na sinanay sa mas makatotohanang mga simulator ay dapat ituring na may higit na antas ng pag-iingat. Sa antas 3, imposible ang hindi tiyak na pagkakakulong, ngunit, na may matatag na seguridad, sa antas ng software, hardware, at social engineering, ang mga tao ay maaaring makinabang mula sa isang nakapaloob na AGI sa isang limitadong kapasidad" (ayon kay Robert Williams at Roman Yampolskiy).

Ang iminungkahing hanay ng mga antas ng potensyal na pagtakas ay nakakapukaw ng pag-iisip. Gaya ng makikita mo sa ilang sandali, ang pagtukoy sa automation sa pamamagitan ng paggamit ng mga nagtapos na antas ay isang kapaki-pakinabang na paraan ng pagkilala sa saklaw at kapasidad ng nasabing automation. Ilalarawan ko para sa iyo ang parehong konsepto na nauugnay sa mga autonomous na sasakyan at AI-based na self-driving na mga kotse. Ang isang kapansin-pansing pagkakaiba ay nagkakahalaga ng pagmamasid. Para sa mga self-driving na kotse, mayroong isang napagkasunduang karaniwang hanay ng mga antas, habang ang mga nakasaad sa itaas na mga antas na potensyal na makatakas ay nagpapakita ng isang paunang at paunang strawman (maaari mong walang alinlangan na asahan na ang mga karagdagang pagpipino ay isasagawa habang ang field ng AI Confinement ay lalong tumatanda) .

Pag-isipan natin ang katwiran o batayan sa pagnanais na makulong ang AI.

Ang pinaka-maliwanag na dahilan upang ikulong ang AI ay upang ihinto ito mula sa mga kaawa-awang gawa. Natuklasan na namin na sa halip na lipulin ang AI, baka gusto naming panatilihing nakakulong ang AI upang ito ay mapatakbo pa rin at samantala ay maiwasang magdulot ng pinsala. Ito ay maaaring o hindi maaaring sabay na magagawa. May pagkakataon na ang AI ay hindi maaaring tumakbo nang angkop habang nakakulong at samakatuwid ay nawawala sa atin ang iba pang kanais-nais na aspeto ng pagkuha ng anumang positibong halaga na hinahangad nating maipon. Isipin ang pagkabalisa ng pagkulong sa AI kahit na ang paggawa nito sa halaga na ang natitirang pinahahalagahan na kakayahan ay hindi na magagamit. Drat!

Mayroong isang tunay na hanay ng mga dahilan upang i-confine ang AI, kabilang ngunit hindi limitado sa:

Kawalan ng kakayahan ng AI
Pagpigil sa AI
Proteksyon para sa mga tao
Proteksyon mula sa mga tao
Rehabilitasyon ng AI
Pagpigil para sa iba pang AI
Paghihiganti laban sa AI
At iba pa

Maaari kang maglaan ng oras upang maingat na pag-isipan ang mga kadahilanang iyon. Ang ilan sa mga dahilan ay madaling makatwiran. Ang ilan sa kanila ay maaaring mukhang mausisa at posibleng hindi makatwiran.

Kapag tinatalakay ang mga human escape artist, may isang bagay na hindi ko nabanggit kanina. Ang isang escape artist ay maaaring gumawa ng kanilang pagtakas nang buo sa kanilang sariling kagustuhan. Madalas na tumakas si Houdini nang walang anumang tulong mula sa sinuman. Iyon ay sinabi, minsan ay gumagamit si Houdini ng isang kasabwat o katulong upang tumulong sa paggawa ng mabuti sa kanyang pagtakas. Makikita mo ang parehong mga aspeto sa mga pagtakas sa bilangguan na binanggit.

Narito kung bakit mahalaga iyon sa dilemma ng AI confinement.

Ipagpalagay na kaya nating i-confine ang AI. Maaaring ito ay sentient AI o maaaring hindi-sentient AI (isasaalang-alang namin ang mga ito nang magkasama, una, at pagkatapos ay paghiwalayin ang mga detalye). Ang AI ay sumusubok na makatakas sa pamamagitan ng ilang electronic o computer-based na panlilinlang. Ipagpalagay na ang AI ay kumikilos nang mag-isa.

Maaaring hindi na kailangang kumilos nang solo ng AI sa mga pagsisikap nitong makatakas. Isang tao ang dumating at hinayaan ang AI na makatakas. Marahil ang tao ay nagbubukas ng isang elektronikong network portal at ang AI ay nagpapadala ng sarili sa iba pang hindi nakakulong na mga computer sa ibang lugar. O marahil ang tao ay gumagawa ng isang kopya ng AI sa isang panlabas na disk drive o memory stick, dinadala ang AI mula sa pagkakakulong, at pagkatapos ay isaksak ang disk o memory stick sa isang hindi nakakulong na computer.

Ang mga tao ay madaling maging mahinang link sa pagsisikap na makulong ang AI.

Bakit sa ano ba hahayaan ng isang tao ang isang AI na makatakas mula sa pagkakulong, maaari kang humihikayat. Tiyak, gugustuhin ng lahat ng tao na panatilihing nakakulong ang AI kung ang AI ay ipinapalagay na sadyang inilagay sa pagkakakulong. Kung iniisip mo ang mga ganitong uri ng pag-iisip, iminumungkahi kong magkaroon ka ng isang medyo masaya na mukha na optimistikong pananaw sa sangkatauhan.

Maaaring maniwala ang isang gumagawa ng masama na maaari nilang gamitin ang AI para gumawa ng masasamang gawain. Maaaring isipin ng ilang gumagawa ng mali na ang AI ay magdudulot ng kalituhan, at walang pakialam kung ito ay kumikita para sa kanila o hindi. Ipinapalagay ng isang tao na ang isang tao ay maaaring nakikiramay sa AI at naniniwala na ang AI ay maling nakulong. Sa at sa ang mga posibilidad ay walang katapusang pumunta.

Mayroong hindi sinasadyang paglabas na maaaring mangyari din. Ang isang tao na walang intensyon na ilabas ang AI ay nagkakamali at voila, ang AI ay pinakawalan. Isaalang-alang na ang isang taong nagnanais na gawing mas mahigpit ang pagkakakulong ay gumagawa ng boo-boo at hindi sinasadyang pinababa ang hirap ng pagkakakulong, na nagpapahintulot sa AI na makatakas.

Kung ang AI ay maaaring makipag-ugnayan sa mga tao habang ang AI ay nakakulong, ang problema ng pagkamit ng AI confine ay malamang na astronomically nadagdagan. Narito kung bakit.

Ang isang AI system ay maaaring gumamit ng social engineering (SE) ploys. Sigurado ako na ginawa mo ito sa iyo ng mga tao. May tumawag sa iyo sa iyong cellphone at sinasabing sila ay mula sa iyong bangko. Sinasabi nila sa iyo na may nag-crack sa iyong bank account. Para ayusin ang break-in, hiningi ng tao ang iyong password. Nakapagtataka, binigay mo ang iyong password sa taong ito. Pagkatapos ay ginagamit nila ito upang mag-log in sa iyong bank account at nakawin ang iyong pera. Ito ay isang halimbawa ng paggamit ng mga diskarte sa social engineering upang ikompromiso ang mga computer system.

Isipin ang isang nakakaramdam na AI na kumikilos nang matalino at sinusubukan ito: "Bukod pa sa mga walang kabuluhang pag-atake ng SE tulad ng pagsisinungaling, pakikipagkaibigan, pamba-blackmail, pag-hypnotize at pagbuo ng isang romantikong relasyon, ang AI ay maaaring gumamit ng ilang mas advanced na mga diskarte. Ang isang ganoong diskarte ay magiging super-bribery. Maaaring kumbinsihin ng AI ang guard na ang pagpapakawala ng AI ay para sa pinakamahusay na interes ng guard. Bilang karagdagan sa pera at kapangyarihan ang bantay ay bibigyan ng perpektong kalusugan, imortalidad o anumang bagay para sa bagay na iyon. Ang diskarte na ito ay gagana lalo na kung ang guwardiya ay may malubhang sakit na malapit na kamag-anak na ipapangako ng AI na pagagalingin. Depende sa mga kakayahan ng AI o bilang resulta ng pagsisinungaling, maaari ding mag-alok ang AI na ibalik ang mga matagal nang namatay na kamag-anak at kaibigan ng guwardiya. Mahirap humanap ng taong mananatiling immune sa gayong mga suhol” (Roman Yampolskiy, “Leakproofing the Singularity Artificial Intelligence Confinement Problem” sa Journal of Consciousness Studies).

Anuman ang ginawang pagkakulong, palaging may potensyal na maaaring abalahin o bawasan ng isang tao ang pagkakulong at payagan ang AI na makatakas. Mukhang posible ito lalo na kung ang AI ay maaaring makipag-usap sa mga tao. Hindi lang ang sinumang tao, kahit na kapag ang AI ay maaaring makipag-ugnayan sa mga sinanay at dalubhasang mga bantay ng tao na diumano'y alam at handa para sa mga trick na maaaring paglaruan ng AI sa kanila.

Ang isang partikular na focal point ng AI Confinement Problem ay tumatalakay sa pagsubok na magtatag ng isang confinement protocol na maaaring magbigay-daan para sa pakikipag-usap sa AI ngunit paghihigpit sa AI upang hindi nito malito o makumbinsi ang mga tao na palabasin ang AI. Sinasabi ng ilan na ang anumang pinahihintulutang komunikasyon ay maaaring magresulta sa AI sa huli na makakuha ng isang tao upang buksan ang pagkakulong. Ang iba ay nag-postulate na ang isang multiple-choice protocol o isang binary encoding ay maaaring isang paraan upang pigilan ang AI mula sa mapanlinlang na lokohin ang isang bantay ng tao.

Nagdudulot ito ng isa pang hanay ng mga antas na maaari naming isaalang-alang. Ang mga antas ng seguridad ng komunikasyon ay maaaring gawin sa ganitong paraan (ayon sa nabanggit na papel):

Antas ng Seguridad ng Komunikasyon 0: Walang limitasyong komunikasyon
Antas ng Seguridad ng Komunikasyon 1: Na-censor na input, hindi na-censor na output
Antas ng Seguridad ng Komunikasyon 2: Mga output lang na walang input
Antas ng Seguridad ng Komunikasyon 3: Walang limitasyong input at censored na output
Antas ng Seguridad ng Komunikasyon 4: Secured na komunikasyon
Antas ng Seguridad ng Komunikasyon 5: Na-censor na output at walang input
Antas ng Seguridad ng Komunikasyon 6: Mga input lamang na walang mga output
Antas ng Seguridad ng Komunikasyon 7: Na-censor na input at walang mga output
Antas ng Seguridad ng Komunikasyon 8: Walang komunikasyon, ganap na nakakulong AI

Ang AI ay maaari ding magkaroon ng iba pang mga trick.

Ipagpalagay na inilagay namin ang AI sa tila hindi matatag na pagkakakulong na binubuo ng isang espesyal na sistema ng computer na lahat ay naka-lock. At pagkatapos ay nangyari ito: "Dagdag pa rito ang AI ay maaaring makisali sa sabotahe ng confinement hardware sa pag-asang makatakas bilang resulta ng mga pagkakamali sa protocol ng seguridad. Halimbawa, maaaring subukan ng AI na tunawin ang hardware sa pamamagitan ng pagtaas ng temperatura mula sa paglalagay ng mataas na computational load sa processor o subukang sirain ang isang hard drive sa pamamagitan ng maraming reads ng parehong lokasyon” (ayon sa binanggit na papel ni Roman Yampolskiy).

Maaari mong idagdag sa mga kahinaan ng pagkakulong na ang lalagyan ng pagkulong o ang pasilidad na kinalalagyan nito ay naaabala dahil sa ilang natural na pagkilos tulad ng buhawi o isang bagyo. Marahil ay maaaring pagsamantalahan ng AI ang pangyayaring iyon. Maaaring ang isang bansang kaaway ng bansang nagtataglay ng AI sa pagkakakulong ay nagpasiya na ang pagsasagawa ng paglabag sa pagkakakulong ay magiging mabuti para magdulot ng panic at magsisilbing patagilid na pag-atake laban sa bansang kanilang inaaming kalaban. Marahil ang mga aktibistang tao na nagpapatunay ng mga karapatan ng AI ay sumalakay sa pasilidad at hinayaan ang AI na kumalas.

Hayaang gumala ang iyong isip tungkol sa maraming mga paraan ng pagkakulong sa AI na nakompromiso.

Sa isa sa mga pinakaunang papel tungkol sa AI Confinement Problem, si Butler Lampson ng Xerox PARC (Palo Alto Research Center) ay naglathala ng isang artikulo noong 1973 na pinamagatang "A Note on the Confinement Problem" na nagmungkahi ng ilang panuntunan sa pag-leak-proof:

Kabuuang paghihiwalay: Ang isang nakakulong na programa ay hindi dapat tumawag sa anumang iba pang programa.
Transitivity: Kung ang isang nakakulong na programa ay tumawag sa isa pang programa na hindi pinagkakatiwalaan, ang tinatawag na programa ay dapat ding nakakulong.
masking: Ang isang programang ikukulong ay dapat pahintulutan ang tumatawag nito na matukoy ang lahat ng mga input nito sa mga lehitimong at tagong channel. Sinasabi namin na ang mga channel ay nakamaskara ng tumatawag.
Pagpapatupad: Dapat tiyakin ng superbisor na ang input ng isang limitadong programa sa mga tagong channel ay sumusunod sa mga detalye ng tumatawag.

Sa puntong ito ng mabigat na talakayan na ito, tataya ako na gusto mo ng ilang mga halimbawa ng paglalarawan na maaaring magpakita ng AI Confinement Problem sa mundo ngayon. Mayroong isang espesyal at tiyak na sikat na hanay ng mga halimbawa na malapit sa aking puso. Nakikita mo, sa aking kapasidad bilang isang eksperto sa AI kasama ang etikal at legal na mga epekto, madalas akong hinihiling na tumukoy ng mga makatotohanang halimbawa na nagpapakita ng mga dilemma ng AI Ethics upang ang medyo teoretikal na katangian ng paksa ay mas madaling maunawaan. Ang isa sa mga pinaka-evocative na lugar na malinaw na nagpapakita ng etikal na AI quandary na ito ay ang pagdating ng AI-based na tunay na self-driving na mga kotse. Ito ay magsisilbing isang madaling gamiting kaso o halimbawa para sa sapat na talakayan sa paksa.

Narito ang isang kapansin-pansing tanong na dapat pag-isipan: Ang pagdating ba ng AI-based na tunay na self-driving na mga kotse ay nagpapaliwanag ng anuman tungkol sa AI Confinement Problem, at kung gayon, ano ang ipinapakita nito?

Bigyan mo ako ng ilang sandali na i-unpack ang tanong.

Una, tandaan na walang taong driver na kasangkot sa isang tunay na self-driving na kotse. Tandaan na ang mga totoong self-driving na kotse ay hinimok sa pamamagitan ng AI driving system. Hindi na kailangan ng taong nagmamaneho sa gulong, at walang probisyon para sa tao na magmaneho ng sasakyan. Para sa aking malawak at patuloy na saklaw ng Autonomous Vehicles (AVs) at lalo na ang mga self-driving na sasakyan, tingnan ang ang link dito.

Gusto kong linawin pa kung ano ang ibig sabihin kapag tinutukoy ko ang mga totoong self-driving na kotse.

Pag-unawa sa Mga Antas Ng Mga Kotse na Nagmamaneho ng Sarili

Bilang paglilinaw, ang mga tunay na self-driving na kotse ay ang mga kung saan ang AI ang ganap na nagmamaneho sa kotse nang mag-isa at walang anumang tulong ng tao sa panahon ng gawain sa pagmamaneho.

Ang mga sasakyang walang driver na ito ay itinuturing na Antas 4 at Antas 5 (tingnan ang aking paliwanag sa ang link na ito dito), habang ang isang kotse na nangangailangan ng isang tao na driver na magbahagi ng pagsisikap sa pagmamaneho ay karaniwang isinasaalang-alang sa Antas 2 o Antas 3. Ang mga kotse na nagbabahagi ng gawain sa pagmamaneho ay inilalarawan bilang semi-autonomous, at karaniwang naglalaman ng iba't ibang uri ng mga awtomatikong add-on na tinutukoy bilang ADAS (Advanced Driver-Assistance Systems).

Wala pang totoong self-driving na kotse sa Level 5, at hindi pa namin alam kung posible itong makamit, o kung gaano katagal bago makarating doon.

Samantala, ang mga pagsusumikap sa Antas 4 ay unti-unting nagsisikap na makakuha ng ilang traksyon sa pamamagitan ng pagsailalim sa napakakitid at piling mga pagsubok sa pampublikong daanan, kahit na mayroong kontrobersya kung ang pagsubok na ito ay dapat payagan per se (tayo ay lahat ng buhay-o-kamatayang guinea pig sa isang eksperimento nagaganap sa aming mga highway at byways, ang ilan ay nakikipaglaban, tingnan ang aking saklaw sa ang link na ito dito).

Dahil ang mga kotse na semi-autonomous ay nangangailangan ng isang driver ng tao, ang pag-aampon ng mga uri ng mga kotse ay hindi magkakaiba sa iba kaysa sa pagmamaneho ng mga maginoo na sasakyan, kaya't hindi gaanong bago ang bawat se upang masakop ang tungkol sa mga ito sa paksang ito (bagaman, tulad ng makikita mo sa isang iglap, ang mga puntos na kasunod na ginawa ay karaniwang naaangkop).

Para sa mga semi-awtonomous na kotse, mahalaga na ang publiko ay kailangang paunang-hayag tungkol sa isang nakakagambalang aspeto na nagmula sa kani-kanina lamang, ibig sabihin, sa kabila ng mga driver ng tao na patuloy na nag-post ng mga video ng kanilang mga sarili na natutulog sa gulong ng isang Antas 2 o Antas 3 na kotse , kailangan nating lahat na maiwasan ang malinlang sa paniniwala na ang driver ay maaaring mag-alis ng kanilang pansin mula sa gawain sa pagmamaneho habang nagmamaneho ng isang semi-awtonomous na kotse.

Ikaw ang responsableng partido para sa mga aksyon sa pagmamaneho ng sasakyan, anuman ang maaaring awtomatikong ihulog sa isang Antas 2 o Antas 3.

Self-Driving Cars At Ang AI Confinement Problem

Para sa Antas 4 at Antas 5 tunay na mga sasakyan sa pagmamaneho sa sarili, walang magiging driver ng tao na kasangkot sa gawain sa pagmamaneho.

Lahat ng mga nasasakupan ay magiging mga pasahero.

Ang AI ay gumagawa ng pagmamaneho.

Ang isang aspeto na agad na tatalakayin ay nagsasaad ng katotohanan na ang AI na kasangkot sa mga AI system sa pagmamaneho ngayon ay hindi nagbabago. Sa madaling salita, ang AI ay kabuuan isang kolektibong pag-program na batay sa computer at mga algorithm, at walang katiyakan na hindi makatuwiran sa parehong pamamaraan na magagawa ng mga tao.

Bakit ito idinagdag na diin tungkol sa AI na hindi nagbabago?

Dahil nais kong bigyang diin na kapag tinatalakay ang papel ng system ng pagmamaneho ng AI, hindi ko inilahad ang mga katangian ng tao sa AI. Mangyaring magkaroon ng kamalayan na mayroong isang patuloy at mapanganib na pagkahilig sa mga araw na ito upang anthropomorphize AI. Sa esensya, ang mga tao ay nagtatalaga ng mala-tao na pakiramdam sa AI ngayon, sa kabila ng hindi maikakaila at hindi maikukuhang katotohanan na wala pang ganitong AI.

Sa paglilinaw na iyon, maaari mong isipin na ang AI sa pagmamaneho system ay hindi natural na kahit papaano ay "malaman" tungkol sa mga aspeto ng pagmamaneho. Ang pagmamaneho at lahat ng mga kinakailangan nito ay kailangang mai-program bilang bahagi ng hardware at software ng self-driving car.

Sumisid tayo sa napakaraming mga aspeto na maglaro sa paksang ito.

Una, mahalagang mapagtanto na hindi lahat ng AI self-driving na mga kotse ay pareho. Ang bawat automaker at self-driving tech firm ay gumagawa ng diskarte nito sa paggawa ng mga self-driving na kotse. Dahil dito, mahirap gumawa ng mga malawak na pahayag tungkol sa kung ano ang gagawin o hindi gagawin ng mga AI driving system.

Bukod dito, tuwing isinasaad na ang isang sistema ng pagmamaneho ng AI ay hindi gumagawa ng isang partikular na bagay, maaari itong, sa paglaon, ay abutan ng mga developer na sa katunayan ay program ang computer upang gawin ang bagay na iyon. Hakbang-hakbang, ang mga sistema ng pagmamaneho ng AI ay unti-unting napapabuti at pinalawak. Ang isang umiiral na limitasyon ngayon ay maaaring hindi na umiiral sa isang hinaharap na pag-ulit o bersyon ng system.

Pinagkakatiwalaan ko na nagbibigay ng isang sapat na litanya ng mga pag-uusap upang mabahayan kung ano ang malapit kong maiugnay.

Nakahanda na kami ngayon na gumawa ng malalim na pagsisid sa mga self-driving na kotse at ang AI Confinement Problem.

Maaaring alam mo na may mga naiulat na pagkakataon ng Level 2 na mga semi-autonomous na kotse na may nagmamanehong tao at ang tao ay nakatulog habang aktibong tumatakbo sa isang freeway o highway. Ang nakakatakot na aspeto ng Level 2 at Level 3 ay ang driver ng tao ang namamahala pa rin sa pagmamaneho, at gayunpaman maaari silang mahuli sa maling paniniwala na ang AI o automation ay ganap na may kakayahang magmaneho ng kotse nang mag-isa. Ang pagtulak upang matiyak na sinusubaybayan ng isang onboard monitoring system ang driver ng tao at ang kanilang katayuan sa pagmamaneho ay isang paraan upang subukan at pagaanin ang pagiging-lulled proclivity.

Ang mga kuwento ng balita ay nagpakita ng mga pagkakataon kung saan ang isang pulis sa kanilang sasakyan ng pulis ay nagmamaniobra sa harap ng Level 2 na sasakyan, pagkatapos ay unti-unting nagpasyang pabagalin ang kanilang sasakyang pangpulis, na kung saan ay hindi direktang humantong sa Antas 2 na sasakyan ay bumagal nang katumbas. Ang nakakatuwang trick na ito ay nakabatay sa ideya na ang Level 2 na kotse ay may ilang anyo ng mga sensor device gaya ng mga video camera, radar, LIDAR, o mga katulad nito na ginagamit upang makita ang mga sasakyan na nauuna sa Level 2 na kotse. Sa pag-detect ng sasakyan sa harap ng Level 2 na kotse, awtomatikong ia-adjust ng automation ang bilis nito ayon sa bilis ng sasakyan sa unahan.

Maaari mong sabihin na ang AI ay pagiging hikayat bumagal.

Ipagpalagay na ang AI o automation sa kaso ng isang tila runaway na semi-autonomous (o kahit na ganap na autonomous na self-driving) na kotse ay naka-program upang lumipat ng mga lane at maiwasang mabara ng sasakyan sa harap ng kotse.

Ano pa ang maaari nating gawin upang labanan ito?

Maaari mong subukang palibutan ang naliligaw na sasakyan na may buong posse ng mga sasakyan ng pulis. Iposisyon ang isa sa harap ng target na sasakyan, iposisyon ang isa pa sa kaliwa, isa pa sa kanan, at ang isa ay direkta sa likod ng tumakbong kotse. Naka-box in na ngayon ang sasakyan. Maliban kung ito ay umusbong ng mga pakpak, hindi ito maaaring makatakas sa pagkaospital.

Pansinin na ito ay isang anyo ng pisikal na pagkakulong. Halos tulad ng paglalagay ng isang hayop sa isang hawla o pagpilit ng isang robot sa isang selda ng bilangguan. Para sa mga system na nakabatay sa AI na pangunahing mga robot, ang pagkakulong ay maaaring madalas na isang pisikal na anyo ng pagkakulong kung saan ang AI ay kailangang mahigpit na kontrolin. Tandaan na ang isang self-driving na kotse ay mahalagang isang uri ng robot. Malamang na hindi mo iniisip ang mga self-driving na kotse sa ganoong paraan, ngunit sa pangkalahatan ang mga ito ay sa katunayan ay mga robot na may mga gulong at nagmamaneho sa aming mga daanan.

Ang isang malaking problema sa ganitong paraan ng pagkulong ay hindi natin alam kung ano ang magiging reaksyon ng AI driving system. Posibleng unti-unting bumagal ang lahat ng sasakyan ng pulis nang sabay-sabay at sana ay ganoon din ang takbo ng tumakas na sasakyan (hindi ito makakalipat ng mga lane o makakalabas sa nakaharang na kulungan). Yan ang happy face scenario.

Hindi natin alam kung ito ang mangyayari.

Maaaring ang AI ay hindi mahusay na ginawa, o may mga error, at ito ay nagtatapos sa pagrampa ng isa o higit pa sa mga sasakyan ng pulisya. Ipagpalagay na ang mga opisyal ay hindi napatay, maaari itong magligtas ng mga buhay sa lahat ng sinabi, kahit na ang mga opisyal ay maaaring masugatan at ang lahat ng mga sasakyan ay maaaring masira nang husto.

Ang isang mas failsafe na paraan ng pagkakulong para sa isang self-driving na kotse ay ang ilagay ang sasakyan sa isang secure na garahe na makakahuli sa walang driver na sasakyan. Ang naunang halimbawa tungkol sa isang sasakyan ay mas kumplikado dahil ang sasakyan ay mahalagang malayang gumala. Ang paglalagay ng self-driving na kotse sa isang naka-lock na garahe ay maaaring magkulong sa mahalagang AI robotic system, ngunit kung may magbubukas ng garahe o kahit papaano ay magagawa ng AI na buksan nang elektroniko ang mga pintuan ng garahe, maaaring magkaroon ng pagtakas o uri ng jailbreak.

Iyon ay nagpapakita ng pisikal na katangian ng AI confinement. Susunod, isaalang-alang ang mga aspeto ng software ng AI confinement.

Ipagpalagay para sa kapakanan ng talakayan na ang AI sa pagmamaneho system ay tumatawag sa mga shot kung paano ang self-driving na kotse ay pagpunta sa gumana. Nagpapakita ito ng isa pang paraan para sa pagkakulong, na binubuo ng pagsubok na i-confine ang AI driving system per se na nasa sasakyan.

Ang isang paraan ay maaaring magkaroon ng pre-built o programmed virtual confinement sa paligid ng AI driving system na palaging umiiral sa onboard na computer na nagpapatakbo ng AI ng sasakyan. Maaari tayong magpadala ng electronic signal sa code ng pagkakulong o pagkakulong na nagpapahiwatig na magpatuloy at ma-trap ang AI driving system, na pumipigil sa AI sa pagpapatakbo ng self-driving na kotse. Maaaring i-activate ng ilang paunang inayos na espesyal na signal ang pagkakulong at harangan ang AI driving system. Sa gayon, mapipigilan nito ang AI na magamit ang mga kontrol sa pagmamaneho, na epektibong i-overrule ang self-driving na kotse mula sa pagpapatuloy sa pamamagitan ng alinman sa mga utos ng AI.

Kailangan nating alalahanin kung paano ito gumagana. Ang isang self-driving na kotse na tumatakbo sa bilis ng highway ay maaaring maging isang mapanganib na hindi ginagabayan na missile kung biglang ipinatupad ang pagkakakulong at ang AI ay biglang hindi na nakapagmaneho ng autonomous na sasakyan (pinagpapalagay din namin na walang tao. naa-access na mga kontrol sa pagmamaneho na maaaring gamitin ng isang tao upang isagawa ang pagmamaneho).

Paano pa maaaring maging kapaki-pakinabang ang naturang AI confinement sa kaso ng paggamit ng mga self-driving na kotse?

Para sa inyo na nag-aalala tungkol sa posibilidad ng AI na self-driving na mga kotse na sabay-sabay na mag-amok, alinman sa mismong paggawa nito ng AI o dahil sa isang makasalanan na sumisira sa AI, tinalakay ko ang nakakaintriga at nakakabahala na ideyang ito sa ang link dito. Ang built-in na AI confinement configuration ay isa sa ilang paraan para subukan at madaig ang ganitong malisyosong pagkuha sa mga autonomous na sasakyan.

Sigurado ako na napagtanto mo na dahil lamang sa posibleng mayroon kaming ilang binuo o ginawang virtual na kulungan na pumapalibot sa AI ng isang self-driving na kotse ay hindi ito isang garantiya ng matagumpay na pagpigil sa pagtakas ng AI. Maaaring na-program ang isang non-sentient AI na gumawa ng ilang matalinong jailbreak. Ang isang nakakaramdam na AI ay maaaring sapat na matalino upang malaman ang isang paraan sa paligid ng AI confinement o kumbinsihin ang mga tao na palayain ito, tulad ng nabanggit kanina.

Konklusyon

Sa sikat na nobela ng pakikipagsapalaran, Ang Bilang ng mga Monte Cristo, kami ay tinatrato sa isang mapang-akit na kuwento na umiikot sa isang tao na maling nakulong. Nagagawa niyang makatakas. Nakakakuha siya ng malaking kayamanan. Pagkatapos ay naghihiganti siya sa mga nagkulong sa kanya. Kapag mayroon kang oras upang gawin ito, dapat mo talagang basahin ang napakagandang isinulat na kuwento o kahit man lang manood ng isa sa maraming bersyon ng pelikula.

Ang isang hindi malilimutang linya ay ito: “Paano ako nakatakas? Sa kahirapan. Paano ko pinlano ang sandaling ito? May kasiyahan."

Kung tayo ay naglalayon na makulong ang AI, kakailanganin nating gumawa ng maraming maingat na pagpaplano at subukang asahan kung paano magtatag ng walang-kapantay na pagkakakulong (kung posible man iyon). Ang tanong ay lumitaw kung ang AI ay gagawa din ng maingat na pagpaplano tungkol sa kung paano makalaya sa pagkakakulong. Para sa non-sentient AI, maaaring isa itong computational subroutine na binuo sa AI ng mga human developer ng AI. Para sa nararamdamang AI, kung sakaling makita natin ito, ang AI ay maaaring maingat na gumawa ng sarili nitong pagpaplano ng jailbreak.

Magagawa ba nating lutasin ang AI Confinement Problem at makabuo ng isang tiyak na paraan ng pagkulong sa anuman at lahat ng AI system sa isang ganap na escape-proof o ganap na leak-proof na paraan?

Tulad ng sinabi nang mahusay sa pelikula ng bilangguan Ang Shawshank pagtubos, ang ilang mga ibon ay hindi nilalayong makulong.

AI ay maaaring maging ganoong uri ng ibon.

Source: https://www.forbes.com/sites/lanceeliot/2022/05/05/ai-ethics-is-especially-vexed-by-that-ai-confinement-problem-including-the-knotty-particulars- for-confining-autonomous-self-driving-cars/