ओपनएआई का यू-टर्न: एपीआई ग्राहक डेटा पर जीपीटी-4 का प्रशिक्षण नहीं करेगा

ओपनएआई-गोपनीयता-परिवर्तन-6457d3fd3d25f-sej-760x400.png

अपनी पिछली अनुभवों से एक महत्वपूर्ण विचलन के रूप में, OpenAI ने घोषणा की है कि वह अब अपने APIs के माध्यम से भेजे जाने वाले ग्राहक डेटा का उपयोग नहीं करेगा अपने विस्तृत भाषा मॉडल, जैसे कि GPT-4, को ट्रेन करने के लिए।

प्रमुख ने हाल ही में CNBC के साथ हुई एक साक्षात्कार में OpenAI के CEO सैम एल्टमैन द्वारा परिवर्तन की पुष्टि की गई।

यूजर डेटा के लिए OpenAI का नया दृष्टिकोण

OpenAI की नीति में परिवर्तन 1 मार्च, 2023 को प्रभावी हुआ, जब कंपनी चुपचाप अपनी सेवा की शर्तों को अपडेट करके उपयोगकर्ता गोपनीयता के इस नए करार को प्रकट करने लगी।

Altman ने स्पष्ट किया, "ग्राहक स्पष्ट रूप से हमसे अपने डेटा पर प्रशिक्षण नहीं करने की मांग की है, इसलिए हमने अपनी योजना बदल दी है: हम ऐसा नहीं करेंगे।"

APIs (अनुप्रयोग प्रोग्रामन अन्तरमुखियाँ), या अनुप्रयोग प्रोग्रामन अन्तरमुखियाँ, वाणिज्यिक तकनीकी पृष्ठभूमि हैं जो ग्राहकों को सीधे OpenAI के सॉफ़्टवेयर से जोड़ने की अनुमति देती हैं।

आल्टमैन ने कहा कि ओपनएआई ने दौरानी अप्लिकेशन प्रोग्राम इंटरफ़ेस (API) डेटा का उपयोग मॉडल प्रशिक्षण के लिए "कुछ समय से" नहीं कर रहा है, जो इस सामरिक घोषणा को एक मौजूदा अभ्यास का निरकरण करता है।

व्यापार ग्राहकों के लिए प्रभाव

ओपनएआई की कदाचारी की नई ख़बर के बहुत गहरे प्रभाव हैं, विशेषकर इसके व्यापारी ग्राहकों के लिए, जिनमें माइक्रोसॉफ्ट, सेल्सफ़ोर्स और स्नैपचैट जैसे बड़े कंपनियाँ शामिल हैं।

इन कंपनियों के पास ओपनएआई की एपीआई क्षमताओं का उपयोग करने की संभावना अधिक होती है, इसलिए यह निजता और डेटा सुरक्षा की स्थिति विशेष रूप से महत्वपूर्ण है।

फिर भी, नई डेटा संरक्षण उपाय केवल कंपनी की एपीआई सेवाओं का उपयोग करने वाले ग्राहकों के लिए लागू होते हैं। ओपनएआई की अद्यतित सेवा की शर्तों में यह नोट किया गया है, "हम अपी के अलावा सेवाओं से सामग्री का उपयोग कर सकते हैं।"

इस प्रकार, अन्य डेटा इनपुट के रूप में, चैटबॉट ChatGPT में दर्ज किया गया पाठ इस्तेमाल किया जा सकता है, जब तक डेटा API के माध्यम से साझा नहीं किया जाता है।

उद्योग पर व्यापक प्रभाव

ओपनएआई की नीति परिवर्तन उस समय हो रहा है जब उद्योग समझौते में हैं कि विशाल भाषा मॉडल के असर के संभावित प्रभाव के साथ, जैसे कि OpenAI के ChatGPT द्वारा हुई है, मानवों द्वारा परंपरागत रूप से बनाया जाने वाला सामग्री को बदलने की संभावना है।

उदाहरण के लिए, हाल ही में अमेरिका के राइटर्स गिल्ड ने हड़ताल शुरू किया था जब गिल्ड और मूवी स्टूडियों के बीच वार्ता टूट गई थी। गिल्ड ने स्क्रिप्ट जनरेशन या पुनर्लेखन के लिए OpenAI's ChatGPT के उपयोग पर प्रतिबंध लगाने की मांग की थी।

OpenAI का निर्णय उपयोगकर्ता डेटा का प्रशिक्षण में नहीं करने का एक महत्वपूर्ण क्षण है, जो डेटा गोपनीयता और AI के संबंध में चल रही वार्ता के बारे में हो रही है। कंपनियां AI प्रौद्योगिकी की सीमाओं का पता लगाती रहेंगी और भरोसा बनाए रखने के लिए प्रयास करेंगी, तो उपयोगकर्ता गोपनीयता और विश्वास को बनाये रखना इन वार्तालापों में महत्वपूर्ण रहेगा।

चैटजीपीटी का विकास: GPT-3 से GPT-4 तक

महत्वपूर्ण तथ्य यह है कि OpenAI का अपने ग्राहकों के डेटा का उपयोग प्रशिक्षण के लिए नहीं करने का वचन उसके नवीनतम भाषा मॉडल GPT-4 के लिए लागू होता है, जो 14 मार्च, 2023 को जारी किया गया है।

GPT-4 ने अपने पूर्वज, GPT-3 की तुलना में कई सुधार किए हैं, जिसमें शब्द सीमा का बड़ा संवर्धन (ChatGPT की 3,000 शब्द सीमा की तुलना में 25,000) , अधिक संदर्भ विंडो का आकार, और बेहतर तर्क और समझने की क्षमता शामिल हैं।

जीपीटी-4 की एक और महत्वपूर्ण विशेषता उसकी बहु-संरचनात्मकता है, यानी पाठ के अतिरिक्त छवियों से जानकारी को समझने और अनुमान लगाने की क्षमता। यह नवीनतम मॉडल और मानव-साधूलता के पाठ उत्पन्न करता है, व्यक्तिगत का अनुभव बढ़ाने के लिए इमोजी जैसे फीचर्स का उपयोग करता है।

फिर भी, GPT-4 का ठीक आकार और वास्तुकला अज्ञात हैं, जिससे मॉडल के विवरण के बारे में अनुमान हो रहे हैं।

इन अफवाहों के बावजूद, OpenAI के CEO ने मॉडल के आकार के बारे में विशेष दावों को खारिज कर दिया है।

क्षमता के मामले में, GPT-4 ने टेक्स्ट जनरेशन में कुछ मजबूतियां दिखाई हैं लेकिन कुछ सीमाएं भी हैं। उदाहरण के लिए, इसने ग्रेजुएट रिकॉर्ड परीक्षा (GRE) राइटिंग में 54वें प्रतिशत प्राप्त किया और AP कैलकुलस BC परीक्षा पर 43वें - 59वें प्रतिशत कार्य किया।

इसके अलावा, यह आसान लीटकोड कोडिंग कार्यों पर अच्छा प्रदर्शन करता है, लेकिन कार्य कठिनता बढ़ने पर इसका प्रदर्शन कम हो जाता है।

हालांकि GPT-4 के प्रशिक्षण प्रक्रिया का विवरण आधिकारिक रूप से दस्तावेजीकृत नहीं है, लेकिन यह ज्ञात है कि GPT मॉडल आमतौर पर बड़े स्तर की मशीन लर्निंग के साथ इंटरनेट के विभिन्न पाठ के साथ जुड़ी होती हैं।

उम्मीद करते हैं

ओपनएआई की डेटा उपयोग नीति में हुए परिवर्तनों के परिणामस्वरूप, इसके भाषा मॉडल्स की प्रशिक्षण के लिए उपयोग होने वाले डेटा में एपीआई के माध्यम से साझा की गई जानकारी शामिल नहीं होती है, जब तक उपयोगकर्ता इसे इस उद्देश्य के लिए योगदान देने के लिए निर्देशित नहीं करते हैं।

जबकि यह तकनीक हमारे जीवन में सुधार करती है और एक महत्वपूर्ण भूमिका निभाती है, रोचक है कि कंपनियां डेटा को निजी रखने और लोगों के विश्वास कमाने के बारे में चिंताओं का समाधान कैसे करती हैं।

संबंधित लेख

अधिक देखें >>

HIX.AI के साथ AI की शक्ति को अनलॉक करें!