Ang ChatGPT V4 ay umaasa sa bar, mga SAT at maaaring makilala ang mga pagsasamantala sa mga kontrata ng ETH

Ang GPT-4, ang pinakabagong bersyon ng Artificial Intelligence (AI) chatbot, ChatGPT, ay maaaring makapasa sa mga pagsusulit sa high school at mga pagsusulit sa law school na may ranggo ng mga marka sa 90th percentile at may mga bagong kakayahan sa pagproseso na hindi posible sa naunang bersyon.

Ang mga numero mula sa mga marka ng pagsusulit ng GPT-4 ay ibinahagi noong Marso 14 ng lumikha nito na OpenAI na nagpapakitang maaari rin nitong i-convert ang mga input ng imahe, audio at video sa teksto bilang karagdagan sa paghawak ng “higit pang mga nuanced na tagubilin” nang mas malikhain at mapagkakatiwalaan.

"Nakapasa ito sa isang simulate bar exam na may marka sa paligid ng nangungunang 10% ng mga kumukuha ng pagsusulit," idinagdag ng OpenAI. "Sa kabaligtaran, ang marka ng GPT-3.5 ay nasa ibabang 10%."

Ipinapakita ng mga numero na nakamit ng GPT-4 ang markang 163 sa ika-88 na porsyento sa pagsusulit sa LSAT — ang pagsusulit ng mga mag-aaral sa kolehiyo ay kailangang pumasa sa United States para matanggap sa law school.

Mga resulta ng pagsusulit ng GPT-4 at GPT-3.5 sa isang hanay ng mga kamakailang pagsusulit sa US. Pinagmulan: OpenAI

Ang marka ng GPT4 ay maglalagay nito sa isang magandang posisyon upang matanggap sa isang nangungunang 20 law school at ilang marka lamang ang kulang sa mga naiulat na marka na kailangan para sa pagtanggap sa mga prestihiyosong paaralan tulad ng Harvard, Stanford, Princeton o Yale.

Ang naunang bersyon ng ChatGPT ay nakakuha lamang ng 149 sa paglalagay nito ng LSAT sa pinakamababang 40%.

Ang GPT-4 ay nakakuha din ng 298 sa 400 sa Uniform Bar Exam — isang pagsusulit na isinagawa ng mga kamakailang nagtapos na mag-aaral ng batas na nagpapahintulot sa kanila na magsanay bilang isang abogado sa anumang hurisdiksyon ng US.

Ang mga marka ng UBE ay kailangang tanggapin upang magsanay ng batas sa bawat hurisdiksyon ng US. Pinagmulan: Pambansang Kumperensya ng mga Bar Examiner

Ang lumang bersyon ng ChatGPT ay nahirapan sa pagsusulit na ito, na nagtapos sa pinakamababang 10% na may markang 213 sa 400.

Tulad ng para sa SAT Evidence-Based Reading & Writing at SAT Math na mga pagsusulit na kinuha ng mga estudyante sa high school ng US upang sukatin ang kanilang kahandaan sa kolehiyo, nakakuha ang GPT-4 sa ika-93 at ika-89 na porsyento ayon sa pagkakabanggit.

Ang GPT-4 ay napakahusay din sa mga "mahirap" na agham, na nag-post ng higit sa average na mga marka ng porsyento sa AP Biology (85-100%), Chemistry (71-88%) at Physics 2 (66-84%).

Mga resulta ng pagsusulit ng GPT-4 at GPT-3.5 sa isang hanay ng kamakailang mga Pagsusulit sa US. Pinagmulan: OpenAI.

Gayunpaman, medyo average ang marka nito sa AP Calculus, na nasa 43r hanggang 59th percentile.

Ang isa pang lugar kung saan kulang ang GPT-4 ay sa mga pagsusulit sa English Literature, na nagpo-post ng mga marka sa ika-8 hanggang 44 na porsyento sa dalawang magkahiwalay na pagsusulit.

Sinabi ng OpenAI na kinuha ng GPT-4 at GPT-3.5 ang mga pagsusulit na ito mula sa 2022-2023 na mga pagsusulit sa pagsasanay, at na "walang partikular na pagsasanay" ang kinuha ng mga tool sa pagpoproseso ng wika:

“Wala kaming partikular na pagsasanay para sa mga pagsusulit na ito. Ang isang minorya ng mga problema sa mga pagsusulit ay nakita ng modelo sa panahon ng pagsasanay, ngunit naniniwala kami na ang mga resulta ay kinatawan."

Ang mga resulta ay nagdulot din ng takot sa komunidad ng Twitter.

Nauugnay: Paano makakaapekto ang ChatGPT sa Web3 space? Mga sagot sa industriya

Nick Almond, ang nagtatag ng FactoryDAO Sinabi ang kanyang 14,300 na tagasunod sa Twitter noong Marso 14 na ang GPT4 ay "tatakutin ang mga tao" at ito ay "babagsak" sa pandaigdigang sistema ng edukasyon.

Ang dating direktor ng Coinbase, si Conor Grogan, ay nagsabing nagpasok siya ng isang live na Ethereum smart contract sa GPT-4 at agad na itinuro ang ilang "mga kahinaan sa seguridad" at binalangkas kung paano magagamit ang code:

Nalaman ng mga naunang pag-audit ng matalinong kontrata sa ChatGPT na ang unang bersyon nito ay may kakayahan din na makita ang mga bug ng code sa isang makatwirang antas din.

Si Rowan Cheung, ang nagtatag ng AI newsletter na "The Rundown" ay nagbahagi ng isang video ng GPT na nagsasalin ng isang iginuhit na kamay na pekeng website sa isang piraso ng papel upang maging code.