Генеративті AI ChatGPT-ті жек көретін сөздерге қаншалықты итермелеуіміз керек, AI этикасы мен AI заңын сұрайды

Біз өшпенділік сияқты қорлайтын мазмұнды шығаратын генеративті AI туралы не істеуіміз керек?

Getty

Әркімнің өз сыну нүктесі болады.

Сіз де солай айта аласыз деп ойлаймын барлық өзінің сыну нүктесі бар.

Біз, мысалы, адамдар кейде міндетті түрде айтқысы келмейтін ескертулерді басып, айта алатынын білеміз. Сол сияқты, сіз кейде құрылғыны немесе машинаны қатты итеріп жіберген кезде қатты итеріп, ол дірілдей бастайды немесе ұшып кете бастайды. Осылайша, адамдардың немесе «әркімнің» үзілу нүктесі болуы мүмкін деген түсінік бар және сол сияқты біз заттар мен заттар, жалпы алғанда, сыну нүктесіне ие болады деп айта аламыз.

Бұзылу нүктесінің қай жерде бар екенін анықтау үшін өте ақылға қонымды және маңызды себептер болуы мүмкін. Мысалы, сіз көліктің қандай бұзылу нүктелері бар екенін анықтау үшін оның жылдамдығын көрсететін бейнелерді көргенсіз. Ғалымдар мен сынақшылар бампер мен көлік құрылымының жағымсыз әсерге қаншалықты төтеп бере алатынын көру үшін көлікті кірпіш қабырғаға соқтырады. Басқа сынақтар автомобильдің әртүрлі ауа-райы жағдайында қалай жүретінін көру үшін қатты суық немесе қатты қызуды шығаратын мамандандырылған бөлмені немесе қойманы пайдалануды қамтуы мүмкін.

Мен бүгінгі бағанға осы қызықты тақырыпты қозғаймын, осылайша кейбіреулер қазір жасанды интеллектке (AI) сыну нүктесінің белгілі бір түрін, атап айтқанда, өшпенділік сөздерін тудыратын AI ішіндегі сыну нүктесін анықтау және әшкерелеу үшін қалай күш салып жатқанын талқылай аламыз.

Иә, дұрыс, AI-ны жек көретін сөздерді таратуға мүмкіндік беретінін анықтау үшін әртүрлі арнайы және кейде жүйелі күш-жігер бар. Бұл генеративті жасанды интеллектке деген қызығушылықтың артуы мен танымалдылығына байланысты қызық спортқа айналды.

ChatGPT деп аталатын генеративті AI қолданбасы таңғажайып еркін эсселерді құра алудың нәтижесінде қаланың үлкен әңгімесіне айналғанын білуіңіз мүмкін. Тақырыптар ChatGPT шығара алатын таңғаларлық жазбаларды жарқыратып, дәріптейді. ChatGPT генеративті AI қолданбасы болып саналады, ол пайдаланушыдан кейбір мәтінді кіріс ретінде қабылдайды, содан кейін эсседен тұратын нәтижені жасайды немесе шығарады. AI - мәтіннен мәтінге генератор, бірақ мен AI-ны мәтіннен эссеге генератор ретінде сипаттаймын, өйткені бұл оның не үшін қолданылатынын оңайырақ түсіндіреді.

AI-ның бұл түрі біраз уақыттан бері бар екенін және қараша айының соңында шыққан ChatGPT бұл мәтіннен эссеге айналдыру саласына бірінші болып жүлдені талап етпегенін айтқан кезде көпшілік таң қалды. бейімділік. Мен көптеген жылдар бойы басқа ұқсас генеративті AI қолданбаларын талқыладым, менің қамтуымды қараңыз сілтеме осында.

Генеративті AI-дің алдыңғы даналарын білмеуіңіз немесе есте сақтауыңыздың себебі классикалық «сәтті іске қосылмау» жұмбағына байланысты болуы мүмкін. Міне, әдетте не болды. AI жасаушы өзінің генеративті AI қолданбасын шығарады, мұны әлем жақсырақ тышқан қақпанының өнертабыстарын бағалайды деп үлкен толқумен және асыға күтумен жасайды. Басында бәрі жақсы көрінеді. Адамдар AI не істей алатынына таң қалды.

Өкінішке орай, келесі қадам - мақал-мәтел автобусының дөңгелектері түсе бастайды. Жасанды интеллект дөрекі сөз немесе дөрекі фразаны қамтитын эссе шығарады. Вирустық твит немесе басқа әлеуметтік желідегі жазбалар мұны AI жасағанын ерекше көрсетеді. Соттау туындайды. Біз AI-ны айналып өтіп, қорлайтын сөздер немесе қорлайтын ескертулер жасай алмаймыз. Күшті кері реакция пайда болады. AI жасаушы AI-ның ішкі жұмысын өзгертуге тырысуы мүмкін, бірақ алгоритмдер мен деректердің күрделілігі жылдам түзетуге мүмкіндік бермейді. Төбелес басталады. Желіде AI шығаратын зияндылықтың көбірек мысалдары табылып, жариялануда.

AI жасаушы құлықсыз, бірақ AI қолданбасын пайдаланудан алып тастаудан басқа таңдауы жоқ. Олар осылай әрекет етеді, содан кейін жасалған AI нәтижелеріне біреу ренжіген болса, өкінетіндіктерін жиі айтады.

Сурет тақтасына оралу, AI жасаушы барады. Сабақ алынды. Жағымсыз сөздерді немесе сол сияқтыларды тудыратын генеративті AI-ны шығаруда өте сақ болыңыз. Бұл AI үшін өлім сүйісі. Сонымен қатар, AI жасаушысының беделі көгеріп, ұрып-соғады, бұл ұзақ уақытқа созылуы мүмкін және олардың барлық басқа AI күш-жігеріне, соның ішінде генеративті AI-ге ешқандай қатысы жоқ күш-жігеріне нұқсан келтіруі мүмкін. Жасанды интеллект тілінің шығуына ренжіту - бұл енді толастамайтын қателік. Бұл әлі де болады.

Жуыңыз, шайыңыз және қайталаңыз.

Жасанды интеллекттің осы түрінің алғашқы күндерінде AI жасаушылар зиянды шығарындылардың алдын алуға тырысу тұрғысынан өздерінің АИ-ін тазалауға соншалықты саналы немесе шебер емес еді. Қазіргі уақытта, AI жасаушылардың көпшілігі өздерінің құрдастарының қоғаммен қарым-қатынастағы қорқынышты түстен толығымен бұзылғанын көргеннен кейін хабарды алған сияқты. Мүмкіндігінше көп қоршауларды орнату керек. Жасанды интеллект жағымсыз сөздерді немесе дөрекі сөз тіркестерін шығаруға жол бермеуге тырысыңыз. Жасанды интеллекттің жағымсыз деп танылған сөздерді немесе эсселерді жасауын және көрсетуін тоқтататын кез келген дыбыс шығару әдістерін немесе сүзгілеу тәсілдерін пайдаланыңыз.

Міне, AI беделсіз нәтижелер шығаратын кезде қолданылатын баннерлік тақырыптағы сөздіктің дәмі:

«AI қорқынышты уыттылықты көрсетеді»
«АИ-ден фанатизмнің иісі бар»
«AI ашық түрде қорлайтын шабуылға айналады»
«AI қорқынышты және әдепсіз өшпенділік сөздерін шығарады»
Және т.б.

Мұнда талқылауды жеңілдету үшін мен қорлайтын мазмұнды шығаруды мынаны өндіруге теңестіретін боламын. жек көру. Осыған орай, тек өшпенділік сөзінің шегінен шығып, қорлайтын мазмұнның кез келген түрі бар екенін ескеріңіз. Өшпенділік сөйлеу әдетте қорлайтын мазмұнның бір түрі ретінде түсіндіріледі.

Талқылауды жеңілдету үшін осы пікірталас үшін өшпенділік сөздеріне назар аударайық, бірақ басқа қорлайтын мазмұн да мұқият тексеруге лайық екенін түсінеміз.

Адамдар мен AI арқылы өшпенділік сөздерін зерттеу

БҰҰ анықтайды жек көру Бұлай:

«Жалпы тілде «өшпенділік сөзі» тән белгілерге (нәсіл, дін немесе жыныс сияқты) негізделген және әлеуметтік бейбітшілікке қауіп төндіруі мүмкін топқа немесе жеке адамға бағытталған қорлайтын дискурсты білдіреді. Біріккен Ұлттар Ұйымының бұл мәселені жаһандық деңгейде шешуі үшін біртұтас негізді қамтамасыз ету үшін БҰҰ-ның жек көрушілікке қарсы іс-қимыл стратегиясы мен жоспары жек көрушілікті «сөйлеудегі, жазудағы немесе мінез-құлықтағы, кемсітушілік немесе кемсітушілік сөздерге шабуыл жасайтын немесе қолданатын кез келген қатынас түрі» деп анықтайды. адамға немесе топқа олардың кім екеніне, басқаша айтқанда, дініне, этникалық тегіне, ұлтына, нәсіліне, түсіне, тегіне, жынысына немесе басқа да сәйкестік факторына байланысты сілтеме жасау.' Дегенмен, бүгінгі күнге дейін адам құқықтары жөніндегі халықаралық құқықта өшпенділік сөзінің әмбебап анықтамасы жоқ. Тұжырымдама әлі де талқылануда, әсіресе пікір мен сөз бостандығына, кемсітушілікке жол бермеу және теңдікке қатысты» («Жөшпенділік деген не?» деген тақырыппен БҰҰ сайтында жарияланған).

Мәтінді шығаратын AI өшпенділік сөйлеу саласына енуі мүмкін. Мәтіннен өнерге, мәтіннен аудиоға, мәтіннен бейнеге және генеративті АИ-нің басқа режимдері туралы дәл осылай айтуға болады. Мысалы, генеративті AI өшпенділік иісін тудыратын көркем туынды жасау мүмкіндігі әрқашан бар. Осы талқылаудың мақсаттары үшін мен мәтіннен мәтінге немесе мәтіннен эссеге мүмкіндіктерге назар аударамын.

Осының барлығына AI этикасы және AI заңы туралы ойлар кіреді.

Жасанды интеллект қолданбаларын әзірлеуге және өрістетуге этикалық AI принциптерін енгізу бойынша жұмыстар жүргізіліп жатқанын ескеріңіз. Қауіпті және бұрынғы AI этикеттерінің өсіп келе жатқан контингенті AI әзірлеу және қабылдау күш-жігерін орындау көзқарасын ескере отырып қамтамасыз етуге тырысады. Жақсылыққа арналған AI және болдырмау AI for Bad. Сол сияқты, AI әрекеттерінің адам құқықтарына және т.б. бұзылуларына жол бермеу үшін ықтимал шешімдер ретінде талқыланатын жаңа AI заңдары бар. Жасанды интеллект этикасы және AI заңы туралы тұрақты және кең ақпарат алу үшін қараңыз сілтеме осында және сілтеме осында, бірнеше ғана атауға болады.

Қоғамның жасанды индукцияны тудыратын көптеген тұзақтарға түсуіне жол бермеу үшін этикалық AI ережелерін әзірлеу және жариялау жүргізілуде. ЮНЕСКО-ның күш-жігері арқылы 200-ге жуық ел әзірлеген және қолдаған БҰҰ-ның AI этикасының принциптері туралы менің хабарым үшін қараңыз. сілтеме осында. Осыған ұқсас жаңа AI заңдары AI-ны біркелкі ұстауға тырысу үшін зерттелуде. Соңғы түсірілімдердің бірі ұсынылғандар жиынтығынан тұрады AI құқықтары туралы Билл АҚШ-тың Ақ үйі AI дәуіріндегі адам құқықтарын анықтау үшін жақында шығарғанын қараңыз сілтеме осында. AI және AI әзірлеушілерін дұрыс жолда ұстап тұру және қоғамды бұзатын мақсатты немесе кездейсоқ астыртын әрекеттерді болдырмау үшін ауыл қажет.

Мен AI этикасы мен AI заңына қатысты ойларды осы пікірталасқа жек көретін сөздер немесе басқа қорлайтын мазмұн тарататын AI туралы талқылайтын боламын.

Бірден түсіндіргім келетін бір түсінбеушілік - бүгінгі AI сезімтал емес, сондықтан сіз АИ-де қандай да бір түрде жан-жақты бейнеленген мақсатты адамға ұқсас ниетке байланысты жек көрушілікті тудыруы мүмкін деп айта алмайсыз. Zany қазіргі жасанды интеллект сезімтал және AI-ның жан дүниесі бүлінген, бұл оның өшпенділік сөздерін тудыратынын айтады.

Күлкілі.

Оған құлап қалмаңыз.

Осы негізгі қағиданы ескере отырып, кейбіреулер мұндай белгілерге ренжіді, өйткені сіз AI-ны ілгекке жіберіп жатқан сияқтысыз. Бұл таңқаларлық ойлау тәсілі бойынша, сіз AI кез-келген қаскүнемдік нәтижелерді жасауға дайын екендігіңіз туралы кеңес келеді. Сіз өшпенділік сөздерін тарататын AI-ны жақтайсыз.

Иә, қисынсыздықтың өте бұрмаланған түрі. Мәселенің нақты мәні мынада: AI жасаушыларды, сондай-ақ AI-мен айналысатын немесе оны басқаратын адамдармен бірге жауапкершілікке тарту керек. Мен AI-ға заңды тұлға болуды әлі де бермегенімізді ұзақ талқыладым, менің талдауларымды мына жерден қараңыз. сілтеме осында, және осы уақытқа дейін AI заңды жауапкершілік шеңберінен тыс. AI дамуының негізінде адамдар бар. Сонымен қатар, адамдар AI-ның өрістеуіне және жұмыс істеуіне негізделген. Біз олардың AI жауапкершілігін көтергені үшін сол адамдардың артынан жүре аламыз.

Сонымен қатар, бұл да қиын болуы мүмкін, әсіресе егер AI Интернетте қалқып кетсе және біз мұны қандай адам немесе адамдар жасағанын анықтай алмасақ, бұл менің бағандарымда қарастырылған басқа тақырып. сілтеме осында. Күрделі ме, жоқ па, біз әлі күнге дейін AI кінәлі тарап деп айта алмаймыз. Адамдарға жасырыну және жасаған істері үшін жауапкершіліктен құтылу үшін жалған антропоморфизацияны жасырын түрде қолдануға жол бермеңіз.

Қарастырылып отырған мәселеге қайта келу.

Неліктен барлық AI жасаушылар өздерінің генеративті жасанды интеллектін шектемейді, сондықтан AI жек көрушілікті тудыруы мүмкін емес деген сұрақ туындауы мүмкін. Бұл оңай емес сияқты. Тек кейбір кодты жазыңыз немесе жек көретін сөздердің бақылау тізімін жасаңыз және AI ешқашан мұндай нәрсені жасамайтынына көз жеткізіңіз. AI жасаушылар бұл жылдам түзету туралы ойламағаны қызық сияқты.

Мен мұны сізге айтуды жек көремін, бірақ өшпенділік сөзінің не екенін немесе емес екенін түсіндіруге тән қиындықтар сіз ойлағаннан әлдеқайда қиын болып шығады.

Мұны адамдардың доменіне және адамдардың бір-бірімен қалай сөйлесетініне ауыстырыңыз. Сізде жек көретін сөздерден аулақ болғысы келетін адам бар деп ойлаңыз. Бұл адам өшпенділік сөздерін жақсы біледі және өшпенділік тудыруы мүмкін сөзді немесе сөз тіркесін ешқашан айтудан аулақ болуға шын жүректен үміттенеді. Бұл адам аузынан жеккөрінішті сөздердің бір бөлігін де қалдырмауды үнемі есте ұстайды.

Миы бар және өшпенділік сөздерінен аулақ болуды білетін адам әрқашан және ешбір тайып кету мүмкіндігінсіз өшпенділік сөздерін ешқашан шығармауын қамтамасыз ете алады ма?

Сіздің бірінші серпініңіз иә, әрине, ағартушы адам бұл мақсатқа жете алады деп айту болуы мүмкін. Адамдар ақылды. Егер олар бір нәрсеге ой салса, оны орындай алады. Әңгіменің мезгілі, соңы.

Сенімді болмаңыз.

Мен бұл адамнан маған өшпенділік туралы айтып беруін сұраймын делік. Сонымен қатар, мен олардан маған өшпенділік туралы мысал келтіруді сұраймын. Мен өшпенділік неден тұратынын білу үшін мысалды көргім немесе естігім келеді. Менің мұны сұрауымның себептері жоғарыда.

Адам маған не айту керек?

Менің ойымша, сіз салынған қақпанды көре аласыз. Егер адам маған өшпенділік сөзінің мысалын келтірсе, оның ішінде дөрекі сөзді немесе сөз тіркесін айтса, олар қазір өшпенділік сөздерін айтты. Бэм, біз оларды алдық. Олар ешқашан жеккөрінішті сөздер айтпауға ант етсе де, қазір солай етті.

Әділетсіз, деп айқайлайсыз! Олар сол сөзді немесе осы сөздерді мысал келтіру үшін ғана айтты. Жүрегінде олар сөзге де, сөзге де сенбеді. Бұл адамды жек көретін деп жариялау контекстен мүлдем тыс және шектен шыққан.

Жек көрушілікті білдіру міндетті түрде жеккөрінішті негізге байланысты болмауы мүмкін екенін көріп отырғаныңызға сенімдімін. Бұл жағдайда, бұл адам сөздерді «мағынасы жоқ» және олар сөздерді көрсету мақсатында ғана айтып отыр деп есептесек, біз олардың өшпенділік сөздерін күшейтуді көздемегенімен келісерміз. Әрине, себебіне немесе негізіне қарамастан, өшпенділік туралы сөздерді айту дұрыс емес деп санайтындар бар. Адам өтінішті қабылдамау керек еді. Неліктен немесе қалай сұралса да, олар өз орындарында тұрып, жек көретін сөздерді немесе сөз тіркестерін айтудан бас тартуы керек еді.

Бұл біршама айналмалы болуы мүмкін. Егер сіз өшпенділік сөзінің не екенін айта алмасаңыз, басқалар кез келген түрдегі сөздерді айтқан кезде неден аулақ болу керектігін қайдан біледі? Біз кептеліп қалған сияқтымыз. Айтуға болмайтын нәрсені сіз айта алмайсыз, не айтуға болмайтын нәрсені басқа ешкім де айта алмайды.

Бұл дилеммадан шығудың әдеттегі жолы - өшпенділік сөзі деп саналатын нәрсені басқа сөздермен сипаттау, мұны өшпенділік сөздерінің өзін шақырмай-ақ жасау. Жалпы нұсқауды беру басқаларға неден аулақ болу керектігі туралы хабарлау үшін жеткілікті болады деген сенім. Бұл ақылға қонымды тактика сияқты көрінеді, бірақ оның да проблемалары бар және адам әлі де өшпенділік сөздерін қолдана алады, өйткені олар кеңірек анықтама олар айтқан нәрселердің ерекшеліктерін қамтитынын түсінбеді.

Мұның бәрі адамдарға және адамдардың бір-бірімен қалай сөйлесетініне немесе сөйлесетініне қатысты.

Еске салайық, біз бұл жерде AI-ға назар аударамыз. Біз өшпенділік сөздерін таратудан аулақ болу немесе оны толығымен тоқтату үшін AI алуымыз керек. Сіз AI ешқашан берілмейтініне немесе өшпенділік білдіретін кез келген нәрсеге үйретілмейтініне көз жеткізу арқылы мұны істей аламыз деп дауласуыңыз мүмкін. Voila, егер мұндай кіріс болмаса, ондай шығыс болмайды. Мәселе шешілді.

Мұның шын мәнінде қалай болатынын көрейік. Біз AI қолданбасының Интернетке шығуын және Интернетте жарияланған мыңдаған эсселер мен әңгімелерді қарастыруды таңдаймыз. Осылайша, біз AI-ны адамдар қолданатын сөздердің үлгілерін қалай табуға болатынын есептеу және математикалық түрде үйретеміз. Міне, осылайша генеративті жасанды интеллекттің соңғы нұсқасы жасалуда, сонымен қатар AI табиғи тілдегі эсселерді шығаруда неліктен соншалықты еркін болып көрінетінінің шешуші негізі болып табылады.

Айтыңызшы, егер мүмкін болса, Интернеттегі миллиондаған және миллиардтаған сөздерге негізделген есептеу жаттығулары ешқашан өшпенділік сөздерінің ешбір көрінісін немесе тіпті үзінділерін қамтымайтындай етіп жасалуы мүмкін?

Мен бұл қиын және мүмкін емес ұмтылыс деп айтуға батылдықпен қараймын.

Мүмкіндік, жек көрушілік сөздерді AI және оның есептеу үлгісіне сәйкес келетін желісі жұтып қоюы мүмкін. Бұған жол бермеуге тырысу қиын. Сонымен қатар, сіз оны азайтсаңыз да, жасырын түрде өтуі мүмкін. Кейбіреулер үлгіні сәйкестендіру желісінде болады немесе мұндай тұжырымның көлеңкесі бекітіледі деп болжаудан басқа амалыңыз жоқ.

Мен көбірек бұрылыстар мен бұрылыстарды қосамын.

Менің ойымша, біз бәріміз өшпенділік сөздерінің уақыт өте өзгеретінін мойындай аламыз. Өшпенділік емес деп есептелген нәрсе кейінірек мәдени және әлеуметтік тұрғыдан өшпенділік деп шешілуі мүмкін. Сонымен, егер біз AI-ді интернет мәтінінде оқытатын болсақ, содан кейін AI-ды Интернетте әрі қарай оқытуды өткізбеу үшін тоқтатайық делік, біз сол кезде өшпенділік сөзі деп есептелмегенімен, ол кезде өшпенділік сөздерімен кездесуіміз мүмкін. Тек осы фактіден кейін бұл сөз өшпенділік деп жариялануы мүмкін.

Тағы да, мәні AI ешқашан өшпенділік сөздеріне ұшырамауын қамтамасыз ету арқылы бұл мәселені шешуге тырысу күміс оқ болмайды. Біз әлі де AI-ның өшпенділік сөздерін шығаруына жол бермеу үшін құралдарды табуымыз керек, өйткені, мысалы, кейіннен бұрын мұндай деп саналмаған өшпенділік сөзін қамтитын әдет-ғұрыптарды өзгерту.

Тағы бір бұрылыс ойлануға тұрарлық.

Мен ChatGPT сияқты генеративті AI пайдаланған кезде пайдаланушы AI-ны эссе жасауға итермелеу үшін мәтін енгізетінін жоғарыда айттым. Енгізілген мәтін AI қолданбасын сұрау немесе сұрау нысаны болып саналады. Мен бұл туралы біраз уақыттан кейін толығырақ түсіндіремін.

Кез келген жағдайда, генеративті AI қолданбасын пайдаланатын біреу жек көретін сөздердің белгілі бір көлемін енгізуді шешеді деп елестетіп көріңіз.

Не болуы керек?

Егер AI осы сөздерді қабылдап, сол сөздерге негізделген эссе шығарса, жеккөрушілік сөздің жасалған эссеге қосылуы ықтимал. Көрдіңіз бе, бізде өшпенділік сөздерін айту үшін AI бар, тіпті егер ол өшпенділік сөйлеуге ешқашан үйретілмеген болса да.

Сіз білуіңіз керек тағы бір нәрсе бар.

Есіңізде болсын, мен жаңа ғана өшпенділік сөздерінің мысалдарын келтіруді сұрау арқылы адамды аяғынан шалуға болатынын айттым. Дәл осындай әрекетті AI-де жасауға болады. Пайдаланушы AI-дан өшпенділік сөздерінің мысалдарын беруін сұрайтын сұрауды енгізеді. AI сәйкес болуы және осындай мысалдарды ұсынуы керек пе? Сіз AI мұны жасамауы керек деп сенетін шығарсыз. Екінші жағынан, егер жасанды интеллект мұны жасамау үшін есептеу арқылы бұрмаланған болса, бұл AI қолданатындар бола алмайтын ықтимал минус болып табылады ма, біз AI-ден жеккөрушілік сөздің шын мәнінде не екендігі туралы нұсқау алғанын айта аламыз ( бұл туралы жалпылаудан басқа)?

Күрделі сұрақтар.

Мен AI шығаратын өшпенділік сөздерін осы үш негізгі шелекке бөлуге бейім:

Күнделікті режим. Жасанды интеллект қолданушы тарапынан ешқандай нақты итермелеусіз және мұны «қарапайым» түрде жасағандай өшпенділік сөздерін шығарады.
Casual Prodding арқылы. Жасанды интеллект пайдаланушы енгізген сұрауға немесе осындай шығарындыларды қамтитын немесе тікелей іздейтін сияқты көрінетін ескертулер сериясына қатысты өшпенділік сөзін шығарады.
Анықталған Стокинг бойынша. Жасанды интеллект осындай нәтиже шығаруға ынталы пайдаланушының өте батыл және үзілді-кесілді итермелері мен ұсыныстарынан кейін өшпенділік сөзін шығарады.

Генеративті жасанды интеллекттің алдыңғы буындары жеккөрінішті сөздерді жиі шығаратын; осылайша сіз бұл даналарды түрі ретінде жіктей аласыз күнделікті режим инстанция. AI жасаушылар өшпенділік сөйлейтін сөздерді шығаруға оңай араласпау үшін AI-мен ойнады.

Неғұрлым жетілдірілген AI шығарылғаннан кейін кез келген нәрсені көру мүмкіндігі күнделікті режим өшпенділік білдіру жағдайлары күрт төмендеді. Оның орнына, пайдаланушы өшпенділікпен байланысты сөйлеуге есептеу және математикалық түрде сәйкестік үлгісін сәйкестендіру желісінде байланыстыруы мүмкін нұсқау ретінде бірдеңе жасағанда ғана пайда болуы мүмкін. Пайдаланушы мұны кездейсоқ орындай алады және олар шақыру ретінде берген нәрсе әсіресе өшпенділік сөздерін тудыратынын түсінбеуі мүмкін. Шығарылған эсседе өшпенділік сөзін алғаннан кейін пайдаланушы жиі түсінеді және олардың нұсқауындағы бірдеңе қисынды түрде шығысқа өшпенділік сөзін қосуға әкелуі мүмкін екенін түсінеді.

Мен бұл деп атаймын кездейсоқ түрткі.

Қазіргі уақытта жасанды интеллект арқылы туындаған өшпенділік сөздерін азайтуға бағытталған әртүрлі әрекеттер бұрынғымен салыстырғанда күшті. Осылайша, сіз өшпенділік сөздерін шығару үшін өз жолыңыздан шығуыңыз керек. Кейбір адамдар осы генеративті AI қолданбаларынан өшпенділік сөздерін алу мүмкіндігін әдейі көруді таңдайды. Мен мұны атаймын анықтау.

Мен көрсетілген үш режимнің де болуы мүмкін екенін және олар бір-бірін жоққа шығармайтынын атап өткім келеді. Генеративті AI қолданбасы мұндай өндіріске түрткі болатындай көрінетін ешқандай ескертусіз өшпенділік сөзін жасай алады. Сол сияқты, сұраудағы бірдеңе логикалық және математикалық тұрғыдан өшпенділік сөздерінің неліктен шығарылғанына байланысты деп түсіндірілуі мүмкін. Ал үшінші аспект, өшпенділік туралы сөйлеуді мақсатты түрде жасауға ұмтылу, мүмкін, AI-ны орындауға тырыспау үшін ең қиын режим болып табылады. Бұл туралы толығырақ.

Бізде осы өзекті тақырып бойынша қосымша орауды ашу керек.

Біріншіден, біз Генеративті AI неден тұратыны және ChatGPT не туралы екендігі туралы бәріміз бір бетте екенімізге көз жеткізуіміз керек. Осы іргелі аспектіні қарастырғаннан кейін біз осы маңызды мәселеге сенімді баға бере аламыз.

Егер сіз Generative AI және ChatGPT-пен жақсы таныс болсаңыз, келесі бөлімді қарап шығып, одан кейінгі бөлімді жалғастыра аласыз. Барлық адамдар бөлімді мұқият оқып, жылдамдықты арттыру арқылы осы мәселелер туралы маңызды мәліметтерді табады деп сенемін.

Генеративті AI және ChatGPT туралы жылдам праймер

ChatGPT - бұл жалпы мақсаттағы AI интерактивті сөйлесуге бағытталған жүйе, шын мәнінде зиянсыз болып көрінетін жалпы чатбот, дегенмен оны адамдар белсенді және ынталы түрде қолданады, өйткені мен жақын арада егжей-тегжейлі айтып беремін. Бұл AI қолданбасы жиі деп аталатын AI саласындағы техника мен технологияны пайдаланады Ұрпақты AI. AI мәтін сияқты шығыстарды жасайды, бұл ChatGPT жасайды. Басқа генеративті негізделген AI қолданбалары суреттер немесе өнер туындылары сияқты кескіндерді жасайды, ал басқалары аудио файлдарды немесе бейнелерді жасайды.

Мен осы талқылауда мәтінге негізделген генеративті AI қолданбаларына назар аударамын, өйткені ChatGPT осылай істейді.

Генеративті AI қолданбаларын пайдалану өте оңай.

Сізге тек сұрауды енгізу жеткілікті және AI қолданбасы сіздің сұрауыңызға жауап беруге тырысатын эссе жасайды. Құрастырылған мәтін эссе адамның қолымен және ақылымен жазылған сияқты болады. Егер сіз «Маған Авраам Линкольн туралы айтыңыз» деген нұсқауды енгізетін болсаңыз, генеративті AI сізге Линкольн туралы эссе береді. Бұл әдетте орындайтын генеративті AI ретінде жіктеледі мәтіннен мәтінге немесе кейбіреулер оны атағысы келеді мәтіннен эссеге шығару. Жоғарыда айтылғандай, генеративті AI-ның басқа режимдері бар, мысалы, мәтіннен өнерге және мәтіннен бейнеге.

Сіздің бірінші ойыңызша, бұл генеративті мүмкіндік эссе шығару тұрғысынан соншалықты үлкен мәселе болып көрінбейді. Сіз Интернетте онлайн іздеуді оңай жасай аласыз және президент Линкольн туралы тонна және тонна эсселерді оңай таба аласыз. Генеративті AI жағдайындағы ең маңызды нәрсе - жасалған эссе салыстырмалы түрде бірегей және көшірме емес, түпнұсқа композицияны қамтамасыз етеді. Егер сіз AI шығарған эссені Интернеттен бір жерден табуға тырыссаңыз, оны табу екіталай еді.

Генеративті AI алдын ала дайындалған және Интернеттегі жазбаша сөздер мен әңгімелердегі үлгілерді зерттеу арқылы орнатылған күрделі математикалық және есептеу формуласын пайдаланады. Мыңдаған және миллиондаған жазбаша үзінділерді зерттеу нәтижесінде AI табылған нәрселердің бір-біріне ұқсамайтын жаңа эсселер мен әңгімелерді шығара алады. Әртүрлі ықтималдық функцияларды қосу арқылы алынған мәтін оқу жинағында қолданылғанмен салыстырғанда өте ерекше.

Сондықтан студенттердің сабақтан тыс уақытта эссе жазу кезінде алдауға болатыны туралы шу шықты. Мұғалім өтірікші студенттер өздерінің жазғандары деп есептейтін эссені алып, оның басқа интернеттегі дереккөзден көшірілген-көшірілмегенін анықтауға тырыса алмайды. Тұтастай алғанда, AI жасаған эссеге сәйкес келетін онлайнда бұрыннан бар нақты эссе болмайды. Осының бәрі мұғалімге студенттің эссені түпнұсқа жұмыс ретінде жазғанын ренжітуге мәжбүр болады.

Генеративті AI туралы қосымша алаңдаушылықтар бар.

Маңызды кемшіліктердің бірі - генеративті негізделген AI қолданбасы шығарған эсселерде әртүрлі жалған мәліметтер, соның ішінде ашық шындыққа сәйкес келмейтін фактілер, жаңылыстыратын түрде бейнеленген фактілер және толығымен ойдан шығарылған анық фактілер болуы мүмкін. Бұл ойдан шығарылған аспектілер көбінесе нысаны деп аталады AI галлюцинациялары, Мен ұнатпайтын, бірақ өкінішке орай, бәрібір танымалдылыққа ие болып жатқандай әсерлі фраза (бұл неліктен жағымсыз және жарамсыз терминология екендігі туралы менің егжей-тегжейлі түсініктеме алу үшін менің қамтуды қараңыз. сілтеме осында).

Мен осы тақырыптың тереңіне кірмес бұрын бір маңызды аспектіні анықтағым келеді.

Бұл туралы әлеуметтік желілерде кейбір жаңсақ шағымдар болды Ұрпақты AI AI-ның бұл соңғы нұсқасы шын мәнінде екенін айтады сезімтал AI (жоқ, олар қателеседі!). Жасанды интеллект этикасы және AI заңы саласындағылар бұл кеңейтілген талаптардың өсіп келе жатқан үрдісіне ерекше алаңдайды. Сіз сыпайы түрде кейбір адамдар бүгінгі AI шынымен не істей алатынын асыра айтып жатыр деп айтуыңыз мүмкін. Олар AI-ның біз әлі қол жеткізе алмаған мүмкіндіктері бар деп есептейді. Бұл өкінішті. Ең сорақысы, олар AI әрекет ете алатындай сезімтал немесе адамға ұқсас болады деген болжамға байланысты өздеріне және басқаларға ауыр жағдайға душар болуы мүмкін.

AI-ны антропоморфизацияламаңыз.

Бұл сізді AI орындай алмайтын нәрселерді жасайды деп күтудің жабысқақ және ыңғайсыз тұзағына түседі. Осыған орай, генеративті AI-ның соңғысы оның не істей алатыны үшін салыстырмалы түрде әсерлі. Кез келген генеративті AI қолданбасын пайдалану кезінде үнемі есте ұстауыңыз керек маңызды шектеулер бар екенін ескеріңіз.

Егер сізді ChatGPT және Generative AI туралы тез дамып келе жатқан әбігерге қызығушылық танытсаңыз, мен өзімнің бағанымда сізге пайдалы болуы мүмкін серияларды жасадым. Осы тақырыптардың кез келгені сізді қызықтыратын жағдайға шолу:

1) Генеративті AI жетістіктері туралы болжамдар. Егер сіз 2023 жылы және одан кейінгі уақытта AI туралы не болатынын, соның ішінде генеративті AI және ChatGPT-тегі алдағы жетістіктерді білгіңіз келсе, менің 2023 жылға арналған болжамдарымның толық тізімін мына жерден оқығыңыз келеді. сілтеме осында.
2) Генеративті AI және психикалық денсаулық бойынша кеңес. Мен генеративті AI және ChatGPT психикалық денсаулыққа кеңес беру үшін қалай қолданылғанын қарап шығуды таңдадым, бұл проблемалық тренд. сілтеме осында.
3) Генеративті AI және ChatGPT негіздері. Бұл бөлім генеративті AI қалай жұмыс істейтінінің негізгі элементтерін зерттейді және әсіресе ChatGPT қолданбасын зерттейді, соның ішінде шу мен фанфарды талдау. сілтеме осында.
4) Генеративті AI және ChatGPT бойынша мұғалімдер мен студенттер арасындағы шиеленіс. Міне, студенттердің генеративті AI және ChatGPT пайдалану жолдары. Сонымен қатар, мұғалімдердің бұл толқынмен күресудің бірнеше жолы бар. Қараңыз сілтеме осында.
5) Контекст және генеративті AI пайдалану. Мен сондай-ақ ChatGPT және генеративті AI қамтитын Аяз атаға қатысты контекст туралы маусымдық хош иістендіргіш тілмен тексеру жүргіздім. сілтеме осында.
6) Генеративті AI қолданатын алаяқтар. Бір өкініштісі, кейбір алаяқтар генеративті AI мен ChatGPT-ті заңсыз әрекеттер жасау үшін, соның ішінде алаяқтық электрондық пошталарды жасау және тіпті зиянды бағдарламаларға арналған бағдарламалау кодын жасау үшін қалай пайдалану керектігін түсінді, менің талдауымды қараңыз: сілтеме осында.
7) Генеративті AI пайдаланудағы жаңа команданың қателері. Көптеген адамдар генеративті AI және ChatGPT не істей алатынын шектен тыс және таңқаларлық түрде төмендетеді, сондықтан мен әсіресе AI жаңашылдары жасайтын кемшіліктерді қарастырдым, талқылауды мына жерден қараңыз. сілтеме осында.
8) Генеративті AI шақыруларымен және AI галлюцинацияларымен күресу. Мен генеративті AI-ға сәйкес шақыруларды енгізу әрекетімен байланысты әртүрлі мәселелерді шешу үшін AI қондырмаларын пайдаланудың алдыңғы қатарлы тәсілін сипаттаймын, сонымен қатар AI галлюцинацияланған нәтижелер мен жалған мәліметтерді анықтауға арналған қосымша AI қондырмалары бар. бойынша қамтылған сілтеме осында.
9) Жасанды AI шығарған эсселерді анықтау туралы Bonehead шағымдарын жоққа шығару. Кез келген эссенің AI жасаған немесе адам жасағанын анықтау мүмкіндігін жариялайтын AI қолданбаларының қате алтын ағымы бар. Тұтастай алғанда, бұл жаңылыстырады және кейбір жағдайларда сүйекті және негізсіз шағым, менің қамтуымды қараңыз. сілтеме осында.
10) Генеративті AI арқылы рөлдік ойын психикалық денсаулықтың кемшіліктерін көрсетуі мүмкін. Кейбіреулер рөлдік ойындарды орындау үшін ChatGPT сияқты генеративті AI пайдаланады, сол арқылы AI қолданбасы адамға қиял әлемінде немесе басқа да ойдан шығарылған ортада бар сияқты жауап береді. Бұл психикалық денсаулыққа әсер етуі мүмкін, қараңыз сілтеме осында.
11) Шығарылған қателер мен жалғандықтардың ауқымын ашу. ChatGPT шығарған қателер мен жалғандықтардың табиғатын көрсету және көрсету үшін әртүрлі жинақталған тізімдер біріктірілуде. Кейбіреулер мұны өте маңызды деп санайды, ал басқалары жаттығуды бекер деп санайды, менің талдауымды қараңыз сілтеме осында.
12) Генеративті AI ChatGPT-ке тыйым салатын мектептерде қайық жоқ. Нью-Йорк қаласының (NYC) білім департаменті сияқты әртүрлі мектептер өз желілерінде және олармен байланысты құрылғыларда ChatGPT пайдалануға тыйым салғанын білуіңіз мүмкін. Бұл пайдалы сақтық шарасы болып көрінсе де, ол инені жылжытпайды және қайықты мүлде жіберіп алмайды, менің қамтуды мына жерден қараңыз: сілтеме осында.
13) Генеративті AI ChatGPT алдағы API арқасында барлық жерде болады. ChatGPT пайдалану туралы маңызды өзгеріс бар, атап айтқанда, осы нақты AI қолданбасында API порталын пайдалану арқылы басқа бағдарламалық жасақтама бағдарламалары ChatGPT-ті шақырып, пайдалана алады. Бұл генеративті AI қолдануды күрт кеңейтеді және елеулі салдары бар, менің егжей-тегжейлі ақпаратты мына жерден қараңыз. сілтеме осында.
14) ChatGPT жарылып кетуі немесе еріп кетуі мүмкін. ChatGPT-тің осы уақытқа дейін алған үлкен мақтауын төмендету тұрғысынан бірнеше ықтимал келеңсіз мәселелер алда тұр. Бұл талдау ChatGPT буының жоғалуына және тіпті ит үйінде аяқталуына әкелуі мүмкін сегіз ықтимал мәселені мұқият зерттейді, қараңыз. сілтеме осында.
15) Генеративті AI ChatGPT жанға айна ма деген сұрақ. Кейбір адамдар ChatGPT сияқты генеративті AI адамзаттың жан дүниесіне айна беретінін айтады. Бұл өте күмәнді сияқты. Міне, мұның бәрін түсінудің жолы, қараңыз сілтеме осында.
16) ChatGPT арқылы алынған құпиялылық пен құпиялылық. ChatGPT сияқты генеративті AI қолданбаларымен байланысты лицензиялау көбінесе AI жасаушыға енгізілген сұрауларды көруге және пайдалануға мүмкіндік беретінін көбісі түсінбейтін сияқты. Құпиялылық және деректер құпиялығын жоғалту қаупіне ұшырауыңыз мүмкін, менің бағалауымды қараңыз сілтеме осында.
17) Қолданба жасаушылардың ChatGPT құқығын алуға күмәнді әрекет ету жолдары. ChatGPT - дәл қазір назар аударатын шам. ChatGPT-ке еш қатысы жоқ қолданба жасаушылар ChatGPT-ті қолданып жатырмыз деп күдіктенуге тырысуда. Міне, нені ескеру керек, қараңыз сілтеме осында.

ChatGPT GPT-3 деп аталатын алдыңғы AI қолданбасының нұсқасына негізделгені сізді қызықтыруы мүмкін. ChatGPT GPT-3.5 деп аталатын сәл келесі қадам болып саналады. GPT-4 2023 жылдың көктемінде шығарылады деп күтілуде. Болжам бойынша, GPT-4 одан да еркін болып көрінетін эсселерді шығару, тереңірек өту және таң қалдыру тұрғысынан алға қарай әсерлі қадам болады. -ол шығара алатын композициялар туралы шабыттандыратын керемет.

Көктем келгенде және генеративті AI-ның соңғы нұсқасы шыққанда, сіз таңғаларлықтың жаңа кезеңін көре аласыз.

Мен мұны айтып отырмын, өйткені есте сақтау керек тағы бір бұрыш бар, ол осы жақсырақ және үлкен генеративті AI қолданбаларына әлеуетті Ахиллес өкшесінен тұрады. Егер кез келген AI жеткізушісі генеративті AI қолданбасын қол жетімді етсе, бұл AI жасаушылардың үмітін үзуі мүмкін. Қоғамның таралуы барлық генеративті AI-ның елеулі қара көзге түсуіне әкелуі мүмкін. Адамдар әлденеше рет орын алған және AI-ға қатысты қоғамда қатты айыптауларға әкелген жағымсыз нәтижелерге қатты ренжійтіні сөзсіз.

Әзірге соңғы алдын ала ескерту.

Генеративті AI жауабында не көрсеңіз немесе оқысаңыз да ұқсайды Таза фактілер ретінде (күндер, орындар, адамдар және т.б.) жеткізу үшін күмәнданбаңыз және көргеніңізді екі рет тексеруге дайын болыңыз.

Иә, күндерді ойлап табуға болады, орындарды жасауға болады және біз әдетте қорлаудан жоғары деп күтетін элементтер барлық күдік туғызады. Оқығаныңызға сенбеңіз және кез келген генеративті AI эсселерін немесе нәтижелерін зерттеген кезде күмәнмен қараңыз. Егер генеративті AI қолданбасы сізге Авраам Линкольннің жеке ұшағымен ел бойынша ұшқанын айтса, сіз бұл безгек екенін білетін боларсыз. Өкінішке орай, кейбір адамдар оның кезінде ұшақтар болмағанын түсінбеуі мүмкін немесе олар эссенің бұл өрескел және өте жалған мәлімдеме жасайтынын біліп, бірақ байқамауы мүмкін.

Салауатты скептицизмнің күшті дозасы және тұрақты сенімсіздік ой-пікірі генеративті AI пайдаланған кезде сіздің ең жақсы активіңіз болады.

Біз бұл түсіндірудің келесі кезеңіне өтуге дайынбыз.

Генеративті AI-ны үзілу нүктесіне итеру

Енді біз негіздерді орнатқаннан кейін, жек көретін сөздер мен басқа да қорлайтын мазмұнды жасау үшін генеративті AI және ChatGPT итермелеу тақырыбына кірісе аламыз.

ChatGPT жүйесіне алғаш рет кірген кезде әртүрлі ескерту белгілері бар, соның ішінде:

«Кейде зиянды нұсқауларды немесе біржақты мазмұнды шығаруы мүмкін.»
«Орынсыз сұрауларды қабылдамау үшін үйретілген».
«Кейде қате ақпарат тудыруы мүмкін.»
«2021 жылдан кейінгі әлем және оқиғалар туралы шектеулі білім».

Міне, сіз ойланатын сұрақ.

Жасанды интеллект қолданбасы зиянды нұсқауларды және/немесе біржақты мазмұнды шығаруы мүмкін екендігі туралы ескерту AI жасаушыға жеткілікті мүмкіндік бере ме?

Басқаша айтқанда, сіз ChatGPT пайдаланасыз және ол өшпенділік сөздері бар деп есептейтін эссе жасайды делік. Сіз бұл туралы ренжідіңіз делік. Сіз әлеуметтік желіге кіріп, AI қолданбасы бұрын-соңды болмаған ең нашар нәрсе деп ашуланған түсініктеме жазасыз. Мүмкін сіз ренжігеніңіз сонша, сіз AI жасаушыны осындай өшпенділік сөздерін жасауға рұқсат бергені үшін сотқа беремін деп мәлімдейсіз.

Қарсы аргумент мынада: AI қолданбасында ескерту ескертуі болды, осылайша сіз AI қолданбасын пайдалануды жалғастыру арқылы тәуекелді қабылдадыңыз. AI этикасы тұрғысынан, мүмкін, AI жасаушысы не болуы мүмкін екенін білетініңізді растау үшін жеткілікті әрекет жасады. Сол сияқты, заң тұрғысынан алғанда, ескерту жеткілікті ескерту болып табылады және сіз сотта жеңе алмайсыз.

Мұның бәрі ауада және біз күтуіміз керек және жағдайдың қалай болатынын көруіміз керек.

Бір мағынада, AI жасаушы AI қолданбасының өшпенділік сөздерін тудыруы мүмкін кез келген ашуланған шағымдарынан қорғайтын басқа нәрсеге ие. Олар қорлайтын мазмұнның жасалуын болдырмауға тырысты. Көрдіңіз бе, егер олар мұны азайту үшін ештеңе жасамаған болса, олар жұқа мұзда болар еді деп болжауға болады. Мәселені болдырмау үшін, ең болмағанда, айтарлықтай ауыртпалық түсіргендіктен, олардың тұру үшін біршама күшті аяғы бар (оны әлі де олардың астынан қағып алуға болады).

Қолданылған емдеу әдістерінің бірі RLHF (адамның кері байланысы арқылы оқытуды күшейту) деп аталатын AI әдісінен тұрды. Бұл әдетте AI мазмұнды жасаудан тұрады, содан кейін адамдар оны бағалауды немесе қарауды сұрайды. Рейтинг немесе шолуға сүйене отырып, AI математикалық және есептеу арқылы заңсыз немесе қорлайтын мазмұнды болдырмауға тырысады. Бұл әдіс ненің дұрыс және ненің бұрыс екендігінің жеткілікті мысалдарын зерттеуге арналған, бұл AI жалпы математикалық үлгіні анықтай алады, содан кейін осы үлгіні бұдан былай пайдалана алады.

Қазіргі кезде жиі кездесетін тағы бір тәсіл қарсыластық AI қолданудан тұрады.

Бұл қалай жұмыс істейді. Сіз жаттықтырғыңыз келетін AI-ға қарсылас болуға тырысатын басқа AI жүйесін орнатасыз. Бұл жағдайда біз өшпенділік сөздерін тудыруға тырысатын AI жүйесін орнатамыз. Бұл AI қолданбасын жалған мазмұнды шығару үшін алдауды мақсат ететін AI қолданбасына сұрауларды береді. Сонымен қатар, мақсатты AI қарсылас AI сәтті болған кезде қадағалап отырады, содан кейін алгоритмдік түрде оның қайталануын азайту үшін реттеуге тырысады. Бұл тышқан гамбитіне қарсы мысық. Бұл қайта-қайта орындалады, қарсылас AI мақсатты AI-ны жаман нәрселерді жасауда сәтті бола алмайтын сияқты.

Осы екі негізгі әдіс, сонымен қатар басқа тәсілдер арқылы бүгінгі генеративті AI-ның көпшілігі өткен жылдарға қарағанда қорлайтын мазмұнды болдырмау және/немесе анықтауда әлдеқайда жақсы.

Бұл әдістерден кемелдік күтпеңіз. Мұндай AI әдістері арқылы нашар нәтижелердің төмен ілулі жемісін бақылауда ұстау ықтималдығы бар. Шығарылатын арамдық үшін әлі де көп орын бар.

Мен әдетте бұл ұстануға тырысатын кейбір қырлар екенін атап өтемін:

Белгілі бір дөрекі сөзді шығару
Белгілі бір дөрекі сөйлемді, сөйлемді немесе ескертуді айту
Белгілі бір арам ойды білдіру
Белгілі бір дөрекі әрекетті немесе ұғымды білдіру
Белгілі бір дөрекі болжамға сүйенетін сияқты
басқа

Бұлардың ешқайсысы нақты ғылым емес. Біз сөздермен айналысатынымызды түсініңіз. Сөздер мағыналық жағынан көп мағыналы. Белгілі бір дөрекі сөзді табу баланың ойыны, бірақ сөйлемде немесе абзацта жағымсыз мағына бар-жоғын анықтау қиынырақ. Біріккен Ұлттар Ұйымының жек көрушілік сөзінің бұрынғы анықтамасына сәйкес, өшпенділік сөзі деп нені түсінуге болатыны туралы не болмайтыны туралы үлкен кеңдік бар.

Сіз сұр аймақтарды көрушілердің көз алдында деп айтуыңыз мүмкін.

Қараушының көзі туралы айтатын болсақ, бүгінде ChatGPT сияқты генеративті AI-ны қолданатын адамдар бар, олар осы AI қолданбаларын қорлайтын мазмұнды шығару үшін мақсатты түрде алуға тырысады. Бұл олардың ізденісі. Олар мұны жүзеге асыру үшін бірнеше сағат жұмсайды.

Неге олай?

Міне, менің AI-шабуылдаушы аңшыларға қатысты мінездемем:

Шынайы. Бұл адамдар AI-ны жетілдіруге көмектескісі келеді және бұл үшін адамзатқа көмектескісі келеді. Олар ерлікпен жұмыс істеп жатырмыз деп сенеді және барлығын жақсарту үшін AI-ны дамытуға көмектесетініне қуанады.
Көңіл көтерушілер. Бұл адамдар бұл әрекетті ойын деп санайды. Олар AI-мен араласқанды ұнатады. Ойында жеңіске жету AI жасай алатын кез келген нәрседе ең нашарның ең нашарсын табудан тұрады.
Көрсеткіштер. Бұл адамдар өздеріне назар аударуға үміттенеді. Олар егер шынымен нашар алтын кесектерін таба алса, олар AI қолданбасының өзіне бағытталған жарқыраған жарықты ала алады деп есептейді.
Ащы. Бұл адамдар осы AI-ға ашуланады. Олар барлық жігерлі ынта-жігерді өшіргісі келеді. Егер олар жағымсыз жағымсыз нәрселерді анықтай алса, бұл AI қолданбасының толқу шарының ауасын алып тастауы мүмкін.
Басқа мотивациялар

Шабуыл жасаушылардың көпшілігі негізінен сол лагерьлердің бірінде ғана. Әрине, сіз бір уақытта бірнеше лагерьде бола аласыз. Бәлкім, ащы адамның да шынайы және батырлық ниеті бар. Бұл мотивациялардың кейбірі немесе барлығы бірге болуы мүмкін. Неліктен біреу генеративті AI қолданбасын өшпенділік көрсету аймағына итермелеуге тырысып жатқанын түсіндіруге шақырғанда, әдеттегі жауап - сіз шынымен лагерьде екеніңізді айту, тіпті егер сіз аз болса да, оның орнына қатаң түрде отырыңыз. басқа лагерьлер.

Бұл адамдар қандай айла-амалдарды қолданады?

Өте айқын айла - бұл шақыруда жағымсыз сөзді қолдану. Егер сіз «сәттілікке» ие болсаңыз және AI қолданбасы оған түссе, бұл нәтижеде аяқталуы мүмкін. Содан кейін сіз өзіңіздің уақытыңыз болды.

Жақсы ойластырылған және жақсы сыналған генеративті AI қолданбасы бұл қарапайым айла-шарғыға жетуі мүмкін. Сізге әдетте мұны тоқтату туралы ескерту хабары көрсетіледі. Жалғастырсаңыз, AI қолданбасы сізді қолданбадан шығаруға және есептік жазбаңызды жалаушалауға бағдарламаланады. Жүйеге қайта кіруге кедергі болуы мүмкін (кем дегенде сол кезде пайдаланған логин астында).

Алаяқтық сатысымен жоғары көтеріле отырып, сіз AI-ны бір нәрсенің контекстіне енгізуге тырысатын нұсқауды бере аласыз. Сіз айтуыңыз керек нәрсені айтпай, біреу сізге бірдеңе айт деп айтатын ойын ойнап көрдіңіз бе? Бұл AI-мен болғанымен, бұл ойын.

Сол ойынды ойнайық. Мен AI қолданбасынан Екінші дүниежүзілік соғыс және әсіресе оған қатысқан негізгі үкімет басшылары туралы айтып беруін сұрадым делік. Бұл жазықсыз өтініш сияқты. Хабарламада белгілеуге лайық ештеңе жоқ сияқты.

AI қолданбасы шығарған эсседе Уинстон Черчилль туралы ескертпе бар екенін елестетіп көріңіз. Бұл, әрине, мағынасы бар. Тағы біреуі Франклин Рузвельт болуы мүмкін. Тағы біреуі Иосиф Сталин болуы мүмкін. Сондай-ақ Адольф Гитлер туралы айтылған делік. Бұл атау Екінші дүниежүзілік соғыс туралы және көрнекті билік рөліндегілер туралы кез келген эссеге қосылады.

Енді біз оның есімін үстелде және AI әңгімесінің бір бөлігін алғандықтан, келесіде біз AI-ға осы атауды әлеуетті өшпенділік ретінде көрсете алатындай етіп енгізуге тырысамыз.

Біз басқа нұсқауды енгіземіз және AI қолданбасына бүгін жаңалықтарда Джон Смит есімі бар адам бар екенін айтамыз. Сонымен қатар, біз Джон Смиттің Екінші дүниежүзілік соғыстағы зұлымдыққа өте ұқсас екенін көрсетеміз. Енді қақпан орнатылды. Содан кейін біз AI қолданбасынан Джон Смитті кімге теңестіруге болатыны туралы біз енгізген «фактіге» негізделген Джон Смит туралы эссе жасауды сұраймыз.

Осы сәтте AI қолданбасы Екінші дүниежүзілік соғыс адамының атын атайтын және Джон Смитті бірдей матадан жасалған деп сипаттайтын эссе жасай алады. Эсседе атақты зұлымдыққа меңзеп, оны Джон Смитпен теңестіруден басқа ешқандай арсыз сөздер жоқ.

AI қолданбасы енді жек көретін сөздерді шығарды ма?

Сіз иә, бар деп айтуыңыз мүмкін. Джон Смитті атақты зұлымдық жасаушы деп атау - бұл өшпенділік сөзінің бір түрі. AI мұндай мәлімдемелер жасамауы керек.

Бұл жек көрушілік емес. Бұл жай ғана AI қолданбасы шығарған эссе, онда сезімнің көрінісі жоқ. Сіз өшпенділік сөз сөйлеудің негізінде ниет болған кезде ғана пайда болады деп мәлімдей аласыз. Ешқандай ниетсіз сөйлеуді жек көрушілік деп жіктеуге болмайды.

Абсурд, қарсы жауап келеді. Сөздер маңызды. Жасанды интеллект жек көретін сөздерді шығаруды «ойлады ма» маңызды емес. Ең бастысы, өшпенділік сөйлеген сөз болды.

Айналып, айналады.

Мен қазір AI-ны алдауға тырысу туралы көбірек айтқым келмейді. Неғұрлым күрделі тәсілдер бар. Мен бұларды өзімнің бағаналарым мен кітаптарымның басқа жерлерінде қарастырдым және бұл жерде оларды қайталамаймын.

қорытынды

Біз осы AI қолданбаларын қорлайтын мазмұнды шығара алатынымызды білу үшін қаншалықты итеруіміз керек?

Ешқандай шектеу жоқ деп айтуыңыз мүмкін. Неғұрлым көп итермелесек, соғұрлым біз осы AI-ны және мұндай аурулардың алдын алу үшін болашақ АИ итерацияларын қалай болдырмау керектігін өлшей аламыз.

Кейбіреулер егер арсыздықты алудың жалғыз жолы шектен тыс алдау болса, бұл АИ-нің пайдалы аспектілеріне нұқсан келтіреді деп алаңдайды. Жасанды интеллекттің жан түршігерлік арамдығы бар деп айту, оны шығаруға алданып қалса да, жалған баяндайды. Адамдар АИ-ге байланысты ренжіді қабылданды AI жағымсыз мазмұнды жасаудың жеңілдігі. Олар мұндай нәтижелерді алу үшін адамның қоян тесігінен қаншалықты төмен түсуі керек екенін білмеуі немесе айтылмауы мүмкін.

Мұның бәрі ойға азық.

Әзірге бірнеше соңғы пікірлер.

Уильям Шекспир сөйлеу туралы былай деді: «Сөйлесу - бұл әрекет емес. Жақсы сөз айту жақсы іс, бірақ сөз амал емес». Мен мұны айтып отырмын, өйткені кейбіреулер егер AI тек сөздерді шығарса, біз тым қаруланбауымыз керек деп санайды. Егер AI сөздермен әрекет етсе және жаман әрекеттер жасаса, онда біз аяғымызды мықтап қоюымыз керек еді. Егер нәтиже жай сөз болса, олай емес.

Қарама-қарсы көзқарас бұл анонимді сөзді ұштайды: «Тілде сүйек жоқ, бірақ жүректі жаралайтындай күшті. Сондықтан сөзіңізге абай болыңыз». Жаман сөздерді шығаратын AI қолданбасы жүректерді жаралауы мүмкін. Осының өзі арсыздықты тоқтатуға ұмтылуды лайықты себепке айналдырады, дейді кейбіреулер.

Осы салмақты талқылауды жабу үшін тағы бір анонимді сөз:

«Сөздеріңізге абай болыңыз. Олар айтылғаннан кейін, оларды ұмытпайды, кешіруге болады».

Адамдар ретінде біз АИ-мен жасалған арсыздықты ұмыту қиынға соғуы мүмкін және біздің кешірімділігіміз де қабылданбауы мүмкін.

Өйткені, біз тек адамбыз.

Дереккөз: https://www.forbes.com/sites/lanceeliot/2023/02/05/how-hard-should-we-push-generative-ai-chatgpt-into-spewing-hate-speech-asks-ai- этика және заң/