ChatGPT V4 жолақты, SAT-ды жоғарылатады және ETH келісімшарттарындағы эксплойттарды анықтай алады

GPT-4, жасанды интеллект (AI) чат-ботының соңғы нұсқасы, ChatGPT орта мектеп сынақтарынан және заң мектебінің емтихандарынан 90-шы пайыздық рейтингте ұпай жинай алады және алдыңғы нұсқада мүмкін болмаған жаңа өңдеу мүмкіндіктеріне ие.

GPT-4 сынақ ұпайларының көрсеткіштерін 14 наурызда оның жасаушысы OpenAI бөлісті, ол сонымен қатар «әлдеқайда нюансты нұсқауларды» креативті және сенімді түрде өңдеуден басқа, кескінді, аудио және бейне кірістерін мәтінге түрлендіруге болатындығын көрсетті.

«Ол тест тапсырушылардың ең жақсы 10% жинаған симуляциялық бар емтиханын тапсырады», - деп қосты OpenAI. «Керісінше, GPT-3.5 ұпайы төменгі 10% шамасында болды».

Сандар GPT-4 LSAT емтиханында 163-ші пайыздық көрсеткіште 88 ұпай жинағанын көрсетеді - колледж студенттері заң факультетіне түсу үшін АҚШ-та өтуі керек.

*АҚШ-тың соңғы емтихандарының бірқатары бойынша GPT-4 және GPT-3.5 емтихандарының нәтижелері. Дереккөз:* *OpenAI*

GPT4 ұпайы оны ең жақсы 20 заң мектебіне қабылдау үшін жақсы жағдайға келтіреді және Гарвард, Стэнфорд, Принстон немесе Йель сияқты беделді мектептерге қабылдау үшін қажетті есептелген ұпайлардан бірнеше ұпайға жетпейді.

ChatGPT-тің алдыңғы нұсқасы LSAT-те 149 ұпай жинады, оны 40% төменгі көрсеткішке қойды.

GPT-4 сонымен қатар Бірыңғай адвокаттық емтиханда 298-ден 400 ұпай жинады — бұл сынақты жақында бітірген заң студенттері АҚШ-тың кез келген юрисдикциясында заңгер ретінде жұмыс істеуге мүмкіндік береді.

*UBE ұпайлары АҚШ-тың әрбір юрисдикциясында заңгерлік тәжірибеге қабылдануы керек. Дереккөз:* *Адвокаттардың ұлттық конференциясы*

ChatGPT-тің ескі нұсқасы бұл сынақта 10-ден 213 ұпай жинап, төменгі 400% -да аяқталды.

АҚШ орта мектеп оқушылары өздерінің колледжге дайындығын өлшеу үшін алатын SAT дәлелді оқу және жазу және SAT математика емтихандарына келетін болсақ, GPT-4 сәйкесінше 93 және 89 пайыздық ұпай жинады.

GPT-4 AP биологиясы (85-100%), химия (71-88%) және физика 2 (66-84%) бойынша орташа пайыздық ұпайларды орналастырып, «қатты» ғылымдарда да үздік шықты.

Дегенмен, оның AP Calculus ұпайы 43-тен 59-ға дейінгі пайыздық деңгейге дейін орташа болды.

GPT-4 жетіспейтін тағы бір сала ағылшын әдебиеті емтихандары болды, екі бөлек сынақта 8-ден 44-ші процентильге дейінгі ұпайларды жариялады.

OpenAI GPT-4 және GPT-3.5 бұл сынақтарды 2022-2023 тәжірибе емтихандарынан алғанын және тілді өңдеу құралдарымен «арнайы дайындық» қабылданбағанын айтты:

«Біз бұл емтихандарға арнайы дайындық жүргізген жоқпыз. Емтихандардағы мәселелердің аз бөлігін оқу кезінде модель көрді, бірақ біз нәтижелерді репрезентативті деп санаймыз».

Нәтижелер Twitter қауымдастығында да үрей тудырды.

Қатысты: ChatGPT Web3 кеңістігіне қалай әсер етеді? Өнеркәсіп жауап береді

Ник Алмонд, FactoryDAO негізін қалаушы деді 14,300 наурызда оның Twitter-дегі 14 4 ізбасарлары GPTXNUMX «адамдарды қорқытады» және бұл жаһандық білім беру жүйесін «құлайды» деп мәлімдеді.

Бағалау теориясы бірнеше жыл бойы менің өмірімнің үлкен бөлігі болды. Мен бұл күнді көп жылдар бұрын күтетінмін. Мен сол кездегі резидент сияқты естілдім.
Бірақ... шын мәнінде бұл бақылаусыз бағалаудан басқа кез келген нәрсе осы сәттен бастап аяқталды дегенді білдіреді.
— дрник ️² (@DrNickA) Наурыз 14, 2023

Coinbase-тің бұрынғы директоры Конор Гроган GPT-4-ке тікелей Ethereum смарт-келісімшартын енгізгенін және бірден бірнеше «қауіпсіздік осалдығын» көрсетіп, кодты қалай пайдалануға болатынын айтты:

Мен GPT-4-ке тірі Ethereum келісімшартын тастадым.
Бір сәтте ол қауіпсіздіктің бірқатар осалдықтарын атап өтті және келісімшартты пайдалануға болатын жер үсті аймақтарын көрсетті. Содан кейін ол келісім-шартты пайдаланудың нақты әдісін тексерді pic.twitter.com/its5puakUW
— Конор (@jconorgrogan) Наурыз 14, 2023

Бұрын ChatGPT-тегі смарт келісімшарт аудиті оның бірінші нұсқасы да код қателерін ақылға қонымды дәрежеде анықтауға қабілетті екенін анықтады.

Роуэн Чеунг, «The Rundown» AI ақпараттық бюллетенінің негізін қалаушы GPT қолмен салынған жалған веб-сайтты қағаз парағында кодқа көшіргені туралы бейнемен бөлісті.

Мен жай ғана GPT-4 қолмен салынған эскизді функционалды веб-сайтқа айналдырғанын көрдім.
Бұл ақылсыз. pic.twitter.com/P5nSjrk7Wn
— Роуэн Чеунг (@rowancheung) Наурыз 14, 2023