चैटजीपीटी वॉटरमार्क कैसे काम करता है और इसे क्यों हराया जा सकता है

चैटजीपीटी-वॉटरमार्किंग.जेपीजी

ओपनएआई के चैटजीपीटी ने स्वचालित रूप से सामग्री बनाने का एक तरीका पेश किया, लेकिन इसका पता लगाना आसान बनाने के लिए वॉटरमार्किंग सुविधा शुरू करने की योजना कुछ लोगों को परेशान कर रही है। चैटजीपीटी वॉटरमार्किंग इस प्रकार काम करती है और इसे हराने का कोई तरीका क्यों हो सकता है।

चैटजीपीटी एक अविश्वसनीय उपकरण है जिसे ऑनलाइन प्रकाशक, सहयोगी और एसईओ एक साथ पसंद करते हैं और डरते भी हैं।

कुछ विपणक इसे पसंद करते हैं क्योंकि वे सामग्री संक्षिप्त, रूपरेखा और जटिल लेख तैयार करने के लिए इसका उपयोग करने के नए तरीके खोज रहे हैं।

ऑनलाइन प्रकाशक इस संभावना से डरते हैं कि खोज परिणामों में एआई सामग्री की बाढ़ आ जाएगी, जो मनुष्यों द्वारा लिखे गए विशेषज्ञ लेखों की जगह ले लेगी।

नतीजतन, एक वॉटरमार्किंग सुविधा की खबर जो चैटजीपीटी-लिखित सामग्री का पता लगाने को अनलॉक करती है, चिंता और आशा के साथ प्रत्याशित है।

क्रिप्टोग्राफ़िक वॉटरमार्क

वॉटरमार्क एक अर्ध-पारदर्शी चिह्न (एक लोगो या टेक्स्ट) है जो एक छवि पर एम्बेडेड होता है। वॉटरमार्क संकेत देता है कि कार्य का मूल लेखक कौन है।

यह ज़्यादातर तस्वीरों में और तेज़ी से वीडियो में देखा जा रहा है।

चैटजीपीटी में वॉटरमार्किंग टेक्स्ट में गुप्त कोड के रूप में शब्दों, अक्षरों और विराम चिन्हों के एक पैटर्न को एम्बेड करने के रूप में क्रिप्टोग्राफी शामिल होती है।

स्कॉट आरोनसन और चैटजीपीटी वॉटरमार्किंग

स्कॉट आरोनसन नाम के एक प्रभावशाली कंप्यूटर वैज्ञानिक को जून 2022 में एआई सुरक्षा और संरेखण पर काम करने के लिए ओपनएआई द्वारा नियुक्त किया गया था।

एआई सेफ्टी एक अनुसंधान क्षेत्र है जो उन तरीकों का अध्ययन करता है जिनसे एआई मनुष्यों को नुकसान पहुंचा सकता है और उस तरह के नकारात्मक व्यवधान को रोकने के तरीके बना रहा है।

डिस्टिल वैज्ञानिक जर्नल, जिसमें OpenAI से संबद्ध लेखक शामिल हैं, AI सुरक्षा को इस प्रकार परिभाषित करता है:

"दीर्घकालिक कृत्रिम बुद्धिमत्ता (एआई) सुरक्षा का लक्ष्य यह सुनिश्चित करना है कि उन्नत एआई सिस्टम मानवीय मूल्यों के साथ विश्वसनीय रूप से जुड़े हुए हैं - कि वे विश्वसनीय रूप से वे काम करें जो लोग उनसे करना चाहते हैं।"

एआई एलाइनमेंट एक कृत्रिम बुद्धिमत्ता क्षेत्र है जो यह सुनिश्चित करता है कि एआई इच्छित लक्ष्यों के साथ संरेखित है।

चैटजीपीटी जैसे बड़े भाषा मॉडल (एलएलएम) का उपयोग इस तरह से किया जा सकता है जो ओपनएआई द्वारा परिभाषित एआई संरेखण के लक्ष्यों के विपरीत जा सकता है, जो कि एआई बनाना है जो मानवता को लाभ पहुंचाता है।

तदनुसार, वॉटरमार्किंग का कारण मानवता को नुकसान पहुंचाने वाले एआई के दुरुपयोग को रोकना है।

एरोनसन ने चैटजीपीटी आउटपुट को वॉटरमार्क करने का कारण बताया:

"यह जाहिर तौर पर अकादमिक साहित्यिक चोरी को रोकने में सहायक हो सकता है, लेकिन उदाहरण के लिए, बड़े पैमाने पर प्रचार प्रसार को रोकने में भी मददगार हो सकता है..."

चैटजीपीटी वॉटरमार्किंग कैसे काम करती है?

चैटजीपीटी वॉटरमार्किंग एक ऐसी प्रणाली है जो शब्दों और यहां तक कि विराम चिह्नों के चयन में एक सांख्यिकीय पैटर्न, एक कोड को एम्बेड करती है।

कृत्रिम बुद्धिमत्ता द्वारा बनाई गई सामग्री शब्द चयन के काफी पूर्वानुमानित पैटर्न के साथ तैयार की जाती है।

मनुष्य और एआई द्वारा लिखे गए शब्द एक सांख्यिकीय पैटर्न का पालन करते हैं।

जेनरेट की गई सामग्री में उपयोग किए गए शब्दों के पैटर्न को बदलना टेक्स्ट को "वॉटरमार्क" करने का एक तरीका है जिससे सिस्टम के लिए यह पता लगाना आसान हो जाता है कि क्या यह एआई टेक्स्ट जेनरेटर का उत्पाद है।

एआई सामग्री वॉटरमार्किंग को अनिर्धारित बनाने वाली युक्ति यह है कि शब्दों का वितरण अभी भी सामान्य एआई उत्पन्न पाठ के समान एक यादृच्छिक उपस्थिति है।

इसे शब्दों का छद्म-यादृच्छिक वितरण कहा जाता है।

छद्म यादृच्छिकता शब्दों या संख्याओं की एक सांख्यिकीय रूप से यादृच्छिक श्रृंखला है जो वास्तव में यादृच्छिक नहीं है।

चैटजीपीटी वॉटरमार्किंग वर्तमान में उपयोग में नहीं है। हालाँकि, OpenAI में स्कॉट आरोनसन ने रिकॉर्ड में कहा है कि यह योजनाबद्ध है।

अभी चैटजीपीटी पूर्वावलोकन में है, जो ओपनएआई को वास्तविक दुनिया के उपयोग के माध्यम से "गलत संरेखण" की खोज करने की अनुमति देता है।

संभवतः वॉटरमार्किंग को चैटजीपीटी के अंतिम संस्करण में या उससे पहले पेश किया जा सकता है।

वॉटरमार्किंग कैसे काम करती है इसके बारे में स्कॉट एरोनसन ने लिखा:

“मेरा अब तक का मुख्य प्रोजेक्ट GPT जैसे टेक्स्ट मॉडल के आउटपुट को सांख्यिकीय रूप से वॉटरमार्क करने का एक उपकरण रहा है।

मूल रूप से, जब भी जीपीटी कुछ लंबा पाठ उत्पन्न करता है, तो हम चाहते हैं कि उसके शब्दों के चयन में एक अन्यथा ध्यान न देने योग्य गुप्त संकेत हो, जिसका उपयोग आप बाद में यह साबित करने के लिए कर सकते हैं कि, हाँ, यह जीपीटी से आया है।

एरोनसन ने आगे बताया कि चैटजीपीटी वॉटरमार्किंग कैसे काम करती है। लेकिन सबसे पहले, टोकनाइजेशन की अवधारणा को समझना महत्वपूर्ण है।

टोकनाइजेशन एक ऐसा कदम है जो प्राकृतिक भाषा प्रसंस्करण में होता है जहां मशीन शब्दों को एक दस्तावेज़ में लेती है और उन्हें शब्दों और वाक्यों जैसी अर्थ इकाइयों में तोड़ देती है।

टोकनाइजेशन टेक्स्ट को एक संरचित रूप में बदल देता है जिसका उपयोग मशीन लर्निंग में किया जा सकता है।

टेक्स्ट जनरेशन की प्रक्रिया में मशीन पिछले टोकन के आधार पर यह अनुमान लगाती है कि अगला टोकन कौन सा आएगा।

यह एक गणितीय फ़ंक्शन के साथ किया जाता है जो यह निर्धारित करता है कि अगला टोकन क्या होगा, जिसे संभाव्यता वितरण कहा जाता है।

अगला शब्द कौन सा होगा इसकी भविष्यवाणी की जाती है लेकिन यह यादृच्छिक है।

वॉटरमार्किंग को ही एरोन छद्म यादृच्छिक के रूप में वर्णित करता है, इसमें किसी विशेष शब्द या विराम चिह्न के होने का गणितीय कारण होता है लेकिन यह अभी भी सांख्यिकीय रूप से यादृच्छिक है।

यहां GPT वॉटरमार्किंग की तकनीकी व्याख्या दी गई है:

“जीपीटी के लिए, प्रत्येक इनपुट और आउटपुट टोकन की एक स्ट्रिंग है, जो शब्द हो सकते हैं लेकिन विराम चिह्न, शब्दों के हिस्से या अधिक भी हो सकते हैं - कुल मिलाकर लगभग 100,000 टोकन हैं।

इसके मूल में, GPT पिछले टोकन की स्ट्रिंग पर सशर्त, उत्पन्न करने के लिए अगले टोकन पर लगातार संभाव्यता वितरण उत्पन्न कर रहा है।

तंत्रिका जाल वितरण उत्पन्न करने के बाद, ओपनएआई सर्वर वास्तव में उस वितरण के अनुसार एक टोकन का नमूना लेता है - या 'तापमान' नामक पैरामीटर के आधार पर वितरण का कुछ संशोधित संस्करण।

हालाँकि, जब तक तापमान गैर-शून्य है, आमतौर पर अगले टोकन के चुनाव में कुछ यादृच्छिकता होगी: आप एक ही संकेत के साथ बार-बार दौड़ सकते हैं, और हर बार एक अलग पूर्णता (यानी, आउटपुट टोकन की स्ट्रिंग) प्राप्त कर सकते हैं .

तो फिर वॉटरमार्क करने के लिए, अगले टोकन को बेतरतीब ढंग से चुनने के बजाय, क्रिप्टोग्राफ़िक छद्म यादृच्छिक फ़ंक्शन का उपयोग करके इसे छद्म यादृच्छिक रूप से चुनने का विचार होगा, जिसकी कुंजी केवल OpenAI को ज्ञात है।

पाठ पढ़ने वालों को वॉटरमार्क पूरी तरह से स्वाभाविक लगता है क्योंकि शब्दों का चयन अन्य सभी शब्दों की यादृच्छिकता की नकल कर रहा है।

यह तकनीकी व्याख्या है:

"उदाहरण के लिए, विशेष मामले में कि जीपीटी के पास संभावित टोकन का एक समूह था जिसे उसने समान रूप से संभावित माना था, आप बस अधिकतम जी वाले टोकन को चुन सकते हैं। यह विकल्प उन लोगों के लिए समान रूप से यादृच्छिक लगेगा जो कुंजी नहीं जानते हैं, लेकिन कोई व्यक्ति जो कुंजी जानता है वह बाद में सभी एन-ग्रामों का योग कर सकता है और देख सकता है कि यह असामान्य रूप से बड़ा था।

वॉटरमार्किंग एक गोपनीयता-प्रथम समाधान है

मैंने सोशल मीडिया पर चर्चाएँ देखी हैं जहाँ कुछ लोगों ने सुझाव दिया कि OpenAI अपने द्वारा उत्पन्न प्रत्येक आउटपुट का रिकॉर्ड रख सकता है और उसका पता लगाने के लिए उपयोग कर सकता है।

स्कॉट एरोनसन ने पुष्टि की है कि ओपनएआई ऐसा कर सकता है लेकिन ऐसा करने से गोपनीयता का मुद्दा पैदा होता है। संभावित अपवाद कानून प्रवर्तन स्थिति के लिए है, जिसके बारे में उन्होंने विस्तार से नहीं बताया।

चैटजीपीटी या जीपीटी वॉटरमार्किंग का पता कैसे लगाएं

एक दिलचस्प बात जो अभी तक अच्छी तरह से ज्ञात नहीं है वह यह है कि स्कॉट एरोनसन ने कहा कि वॉटरमार्किंग को हराने का एक तरीका है।

उन्होंने यह नहीं कहा कि वॉटरमार्किंग को हराना संभव है , उन्होंने कहा कि इसे हराया जा सकता है

“अब, पर्याप्त प्रयास से इस सब को हराया जा सकता है।

उदाहरण के लिए, यदि आपने GPT के आउटपुट को संक्षिप्त करने के लिए किसी अन्य AI का उपयोग किया है - तो ठीक है, हम उसका पता नहीं लगा पाएंगे।

ऐसा लगता है कि वॉटरमार्किंग को हराया जा सकता है, कम से कम नवंबर से जब उपरोक्त बयान दिए गए थे।

ऐसा कोई संकेत नहीं है कि वॉटरमार्किंग वर्तमान में उपयोग में है। लेकिन जब यह उपयोग में आएगा, तो यह अज्ञात हो सकता है कि क्या यह खामी बंद कर दी गई थी।

उद्धरण

स्कॉट एरोनसन की ब्लॉग पोस्ट यहां पढ़ें।

संबंधित लेख

अधिक देखें >>

HIX.AI के साथ AI की शक्ति को अनलॉक करें!