ChatGPT V4 жолақты, SAT-ды жоғарылатады және ETH келісімшарттарындағы эксплойттарды анықтай алады

GPT-4, жасанды интеллект (AI) чат-ботының соңғы нұсқасы, ChatGPT орта мектеп сынақтарынан және заң мектебінің емтихандарынан 90-шы пайыздық рейтингте ұпай жинай алады және алдыңғы нұсқада мүмкін болмаған жаңа өңдеу мүмкіндіктеріне ие.

GPT-4 сынақ ұпайларының көрсеткіштерін 14 наурызда оның жасаушысы OpenAI бөлісті, ол сонымен қатар «әлдеқайда нюансты нұсқауларды» креативті және сенімді түрде өңдеуден басқа, кескінді, аудио және бейне кірістерін мәтінге түрлендіруге болатындығын көрсетті.

«Ол тест тапсырушылардың ең жақсы 10% жинаған симуляциялық бар емтиханын тапсырады», - деп қосты OpenAI. «Керісінше, GPT-3.5 ұпайы төменгі 10% шамасында болды».

Сандар GPT-4 LSAT емтиханында 163-ші пайыздық көрсеткіште 88 ұпай жинағанын көрсетеді - колледж студенттері заң факультетіне түсу үшін АҚШ-та өтуі керек.

АҚШ-тың соңғы емтихандарының бірқатары бойынша GPT-4 және GPT-3.5 емтихандарының нәтижелері. Дереккөз: OpenAI

GPT4 ұпайы оны ең жақсы 20 заң мектебіне қабылдау үшін жақсы жағдайға келтіреді және Гарвард, Стэнфорд, Принстон немесе Йель сияқты беделді мектептерге қабылдау үшін қажетті есептелген ұпайлардан бірнеше ұпайға жетпейді.

ChatGPT-тің алдыңғы нұсқасы LSAT-те 149 ұпай жинады, оны 40% төменгі көрсеткішке қойды.

GPT-4 сонымен қатар Бірыңғай адвокаттық емтиханда 298-ден 400 ұпай жинады — бұл сынақты жақында бітірген заң студенттері АҚШ-тың кез келген юрисдикциясында заңгер ретінде жұмыс істеуге мүмкіндік береді.

UBE ұпайлары АҚШ-тың әрбір юрисдикциясында заңгерлік тәжірибеге қабылдануы керек. Дереккөз: Адвокаттардың ұлттық конференциясы

ChatGPT-тің ескі нұсқасы бұл сынақта 10-ден 213 ұпай жинап, төменгі 400% -да аяқталды.

АҚШ орта мектеп оқушылары өздерінің колледжге дайындығын өлшеу үшін алатын SAT дәлелді оқу және жазу және SAT математика емтихандарына келетін болсақ, GPT-4 сәйкесінше 93 және 89 пайыздық ұпай жинады.

GPT-4 AP биологиясы (85-100%), химия (71-88%) және физика 2 (66-84%) бойынша орташа пайыздық ұпайларды орналастырып, «қатты» ғылымдарда да үздік шықты.

АҚШ-тың соңғы емтихандарының бірқатары бойынша GPT-4 және GPT-3.5 емтихандарының нәтижелері. Дереккөз: OpenAI.

Дегенмен, оның AP Calculus ұпайы 43-тен 59-ға дейінгі пайыздық деңгейге дейін орташа болды.

GPT-4 жетіспейтін тағы бір сала ағылшын әдебиеті емтихандары болды, екі бөлек сынақта 8-ден 44-ші процентильге дейінгі ұпайларды жариялады.

OpenAI GPT-4 және GPT-3.5 бұл сынақтарды 2022-2023 тәжірибе емтихандарынан алғанын және тілді өңдеу құралдарымен «арнайы дайындық» қабылданбағанын айтты:

«Біз бұл емтихандарға арнайы дайындық жүргізген жоқпыз. Емтихандардағы мәселелердің аз бөлігін оқу кезінде модель көрді, бірақ біз нәтижелерді репрезентативті деп санаймыз».

Нәтижелер Twitter қауымдастығында да үрей тудырды.

Қатысты: ChatGPT Web3 кеңістігіне қалай әсер етеді? Өнеркәсіп жауап береді

Ник Алмонд, FactoryDAO негізін қалаушы деді 14,300 наурызда оның Twitter-дегі 14 4 ізбасарлары GPTXNUMX «адамдарды қорқытады» және бұл жаһандық білім беру жүйесін «құлайды» деп мәлімдеді.

Coinbase-тің бұрынғы директоры Конор Гроган GPT-4-ке тікелей Ethereum смарт-келісімшартын енгізгенін және бірден бірнеше «қауіпсіздік осалдығын» көрсетіп, кодты қалай пайдалануға болатынын айтты:

Бұрын ChatGPT-тегі смарт келісімшарт аудиті оның бірінші нұсқасы да код қателерін ақылға қонымды дәрежеде анықтауға қабілетті екенін анықтады.

Роуэн Чеунг, «The Rundown» AI ақпараттық бюллетенінің негізін қалаушы GPT қолмен салынған жалған веб-сайтты қағаз парағында кодқа көшіргені туралы бейнемен бөлісті.