यह क्या है और आप इसका उपयोग कैसे कर सकते हैं?

ChatGPT यही है और यह आधुनिक खोज इंजनों के बाद सबसे महत्वपूर्ण उपकरण क्यों हो सकता है

चैटजीपीटी-6393027101बी3सी-एसईजे-1520x800.jpg क्या है

ओपनएआई ने ChatGPT नामक एक लंबी-फ़ॉर्म वाली प्रश्न-उत्तर देने वाली एआई पेश की जो जटिल प्रश्नों का बातचीतपूर्वक उत्तर देती है।

यह एक क्रांतिकारी तकनीक है क्योंकि इसे यह जानने के लिए प्रशिक्षित किया गया है कि जब मनुष्य कोई प्रश्न पूछता है तो उसका क्या मतलब होता है।

कई उपयोगकर्ता मानव-गुणवत्ता वाली प्रतिक्रियाएं प्रदान करने की इसकी क्षमता से चकित हैं, जिससे यह भावना प्रेरित होती है कि इसमें अंततः मनुष्यों के कंप्यूटर के साथ बातचीत करने के तरीके को बाधित करने और जानकारी पुनर्प्राप्त करने के तरीके को बदलने की शक्ति हो सकती है।

ChatGPT क्या है?

ChatGPT , GPT-3.5 पर आधारित OpenAI द्वारा विकसित एक बड़ा भाषा मॉडल चैटबॉट है। इसमें संवादात्मक संवाद शैली में बातचीत करने और ऐसी प्रतिक्रियाएँ प्रदान करने की उल्लेखनीय क्षमता है जो आश्चर्यजनक रूप से मानवीय प्रतीत हो सकती हैं।

बड़े भाषा मॉडल शब्दों की श्रृंखला में अगले शब्द की भविष्यवाणी करने का कार्य करते हैं।

मानव प्रतिक्रिया के साथ सुदृढीकरण सीखना (आरएलएचएफ) प्रशिक्षण की एक अतिरिक्त परत है जो ChatGPT निर्देशों का पालन करने और मनुष्यों के लिए संतोषजनक प्रतिक्रियाएं उत्पन्न करने की क्षमता सीखने में मदद करने के लिए मानव प्रतिक्रिया का उपयोग करती है।

ChatGPT निर्माण किसने किया?

ChatGPT सैन फ्रांसिस्को स्थित कृत्रिम बुद्धिमत्ता कंपनी OpenAI द्वारा बनाया गया था। ओपनएआई इंक. लाभ-लाभ के लिए ओपनएआई एलपी की गैर-लाभकारी मूल कंपनी है।

OpenAI अपने प्रसिद्ध DALL·E के लिए प्रसिद्ध है, जो एक गहन-शिक्षण मॉडल है जो प्रॉम्प्ट नामक पाठ निर्देशों से छवियां उत्पन्न करता है।

सीईओ सैम ऑल्टमैन हैं, जो पहले वाई कॉम्बिनेटर के अध्यक्ष थे।

माइक्रोसॉफ्ट $1 बिलियन डॉलर का भागीदार और निवेशक है। उन्होंने संयुक्त रूप से Azure AI प्लेटफ़ॉर्म विकसित किया।

बड़े भाषा मॉडल

ChatGPT एक बड़ा भाषा मॉडल (एलएलएम) है। बड़े भाषा मॉडल (एलएलएम) को बड़ी मात्रा में डेटा के साथ प्रशिक्षित किया जाता है ताकि यह सटीक अनुमान लगाया जा सके कि वाक्य में अगला शब्द कौन सा आएगा।

यह पता चला कि डेटा की मात्रा बढ़ने से भाषा मॉडल की अधिक कार्य करने की क्षमता बढ़ गई।

स्टैनफोर्ड विश्वविद्यालय के अनुसार:

“GPT-3 में 175 बिलियन पैरामीटर हैं और इसे 570 गीगाबाइट टेक्स्ट पर प्रशिक्षित किया गया था। तुलना के लिए, इसका पूर्ववर्ती, GPT-2, 1.5 अरब मापदंडों पर 100 गुना से अधिक छोटा था।

पैमाने में यह वृद्धि मॉडल के व्यवहार को काफी हद तक बदल देती है - GPT-3 उन कार्यों को करने में सक्षम है जिन पर इसे स्पष्ट रूप से प्रशिक्षित नहीं किया गया था, जैसे अंग्रेजी से फ्रेंच में वाक्यों का अनुवाद करना, कुछ प्रशिक्षण उदाहरणों के साथ।

यह व्यवहार GPT-2 में अधिकतर अनुपस्थित था। इसके अलावा, कुछ कार्यों के लिए, GPT-3 उन मॉडलों से बेहतर प्रदर्शन करता है जिन्हें उन कार्यों को हल करने के लिए स्पष्ट रूप से प्रशिक्षित किया गया था, हालांकि अन्य कार्यों में यह कम पड़ जाता है।

एलएलएम एक वाक्य और अगले वाक्यों में शब्दों की श्रृंखला में अगले शब्द की भविष्यवाणी करते हैं - स्वत: पूर्ण की तरह, लेकिन दिमाग झुकाने वाले पैमाने पर।

यह क्षमता उन्हें पैराग्राफ और सामग्री के पूरे पृष्ठ लिखने की अनुमति देती है।

लेकिन एलएलएम इस मायने में सीमित हैं कि वे हमेशा यह नहीं समझते हैं कि एक इंसान वास्तव में क्या चाहता है।

और यही वह जगह है जहां ChatGPT उपरोक्त मानव प्रतिक्रिया (आरएलएचएफ) प्रशिक्षण के साथ सुदृढीकरण सीखने के साथ अत्याधुनिक में सुधार करता है।

ChatGPT कैसे प्रशिक्षित किया गया?

GPT-3.5 इंटरनेट से कोड और जानकारी के बारे में भारी मात्रा में डेटा पर प्रशिक्षित किया गया था, जिसमें Reddit चर्चा जैसे स्रोत भी शामिल थे, ताकि ChatGPT संवाद सीखने और प्रतिक्रिया देने की मानवीय शैली प्राप्त करने में मदद मिल सके।

ChatGPT मानव फीडबैक (मानव फीडबैक के साथ रीइन्फोर्समेंट लर्निंग नामक एक तकनीक) का उपयोग करके भी प्रशिक्षित किया गया था ताकि एआई को पता चले कि प्रश्न पूछने पर मनुष्य क्या अपेक्षा करते हैं। एलएलएम को इस तरह से प्रशिक्षित करना क्रांतिकारी है क्योंकि यह अगले शब्द की भविष्यवाणी करने के लिए एलएलएम को प्रशिक्षित करने से कहीं आगे जाता है।

मानव प्रतिक्रिया के साथ निर्देशों का पालन करने के लिए प्रशिक्षण भाषा मॉडल नामक मार्च 2022 का एक शोध पत्र बताता है कि यह एक महत्वपूर्ण दृष्टिकोण क्यों है:

“यह कार्य बड़े भाषा मॉडलों के सकारात्मक प्रभाव को बढ़ाने के हमारे उद्देश्य से प्रेरित है, ताकि उन्हें वह करने के लिए प्रशिक्षित किया जा सके जो मनुष्यों का एक समूह उनसे कराना चाहता है।

डिफ़ॉल्ट रूप से, भाषा मॉडल अगले शब्द पूर्वानुमान उद्देश्य को अनुकूलित करते हैं, जो कि हम इन मॉडलों से जो चाहते हैं उसके लिए केवल एक प्रॉक्सी है।

हमारे परिणाम दर्शाते हैं कि हमारी तकनीकें भाषा मॉडल को अधिक उपयोगी, सच्चा और हानिरहित बनाने का वादा करती हैं।

भाषा मॉडल को बड़ा बनाने से वे उपयोगकर्ता के इरादे का पालन करने में स्वाभाविक रूप से बेहतर नहीं बन जाते।

उदाहरण के लिए, बड़े भाषा मॉडल ऐसे आउटपुट उत्पन्न कर सकते हैं जो असत्य, विषाक्त, या उपयोगकर्ता के लिए उपयोगी नहीं हैं।

दूसरे शब्दों में, ये मॉडल अपने उपयोगकर्ताओं के साथ संरेखित नहीं हैं।"

ChatGPT निर्माण करने वाले इंजीनियरों ने दो प्रणालियों, जीपीटी-3 और नए इंस्ट्रक्टजीपीटी ( ChatGPT का एक "सिबलिंग मॉडल") के आउटपुट को रेट करने के लिए ठेकेदारों (जिन्हें लेबलर्स कहा जाता है) को काम पर रखा था।

रेटिंग के आधार पर, शोधकर्ता निम्नलिखित निष्कर्ष पर पहुंचे:

“लेबलर्स GPT-3 के आउटपुट की तुलना में InstructGPT आउटपुट को काफी पसंद करते हैं।

इंस्ट्रक्टजीपीटी मॉडल जीपीटी-3 की तुलना में सत्यता में सुधार दिखाते हैं।

इंस्ट्रक्टजीपीटी जीपीटी-3 की तुलना में विषाक्तता में छोटे सुधार दिखाता है, लेकिन पूर्वाग्रह नहीं।"

शोध पत्र का निष्कर्ष है कि इंस्ट्रक्टजीपीटी के परिणाम सकारात्मक थे। फिर भी, यह भी नोट किया गया कि सुधार की गुंजाइश थी।

"कुल मिलाकर, हमारे नतीजे बताते हैं कि मानवीय प्राथमिकताओं का उपयोग करते हुए बड़े भाषा मॉडल को ठीक करने से कार्यों की एक विस्तृत श्रृंखला पर उनके व्यवहार में काफी सुधार होता है, हालांकि उनकी सुरक्षा और विश्वसनीयता में सुधार के लिए बहुत काम किया जाना बाकी है।"

ChatGPT एक साधारण चैटबॉट से अलग करने वाली बात यह है कि इसे विशेष रूप से किसी प्रश्न में मानवीय इरादे को समझने और सहायक, सच्चे और हानिरहित उत्तर प्रदान करने के लिए प्रशिक्षित किया गया था।

उस प्रशिक्षण के कारण, ChatGPT कुछ प्रश्नों को चुनौती दे सकता है और प्रश्न के उन हिस्सों को हटा सकता है जिनका कोई मतलब नहीं है।

ChatGPT से संबंधित एक अन्य शोध पत्र से पता चलता है कि कैसे उन्होंने एआई को यह अनुमान लगाने के लिए प्रशिक्षित किया कि मनुष्य क्या पसंद करते हैं।

शोधकर्ताओं ने देखा कि प्राकृतिक भाषा प्रसंस्करण एआई के आउटपुट को रेट करने के लिए उपयोग किए जाने वाले मेट्रिक्स के परिणामस्वरूप ऐसी मशीनें आईं जिन्होंने मेट्रिक्स पर अच्छा स्कोर किया, लेकिन मनुष्यों की अपेक्षा के अनुरूप नहीं थीं।

निम्नलिखित इस प्रकार है कि शोधकर्ताओं ने समस्या को कैसे समझाया:

“कई मशीन लर्निंग एप्लिकेशन सरल मेट्रिक्स को अनुकूलित करते हैं जो कि डिज़ाइनर के इरादे के लिए केवल एक मोटा प्रॉक्सी है। इससे समस्याएँ पैदा हो सकती हैं, जैसे क्लिक-बेट को बढ़ावा देने वाली YouTuBypassGPTe अनुशंसाएँ।

इसलिए उन्होंने जो समाधान तैयार किया वह एक ऐसा एआई बनाना था जो मनुष्यों की पसंद के अनुसार अनुकूलित उत्तर दे सके।

ऐसा करने के लिए, उन्होंने विभिन्न उत्तरों के बीच मानव तुलनाओं के डेटासेट का उपयोग करके एआई को प्रशिक्षित किया ताकि मशीन यह अनुमान लगाने में बेहतर हो सके कि मानव ने क्या उत्तर संतोषजनक माने।

पेपर साझा करता है कि प्रशिक्षण Reddit पोस्टों को सारांशित करके किया गया था और समाचारों को सारांशित करके भी परीक्षण किया गया था।

फरवरी 2022 के शोध पत्र को लर्निंग टू समराइज़ फ्रॉम ह्यूमन फीडबैक कहा जाता है।

शोधकर्ता लिखते हैं:

“इस काम में, हम दिखाते हैं कि मानवीय प्राथमिकताओं के अनुकूलन के लिए एक मॉडल को प्रशिक्षित करके सारांश गुणवत्ता में उल्लेखनीय सुधार करना संभव है।

हम सारांशों के बीच मानव तुलनाओं का एक बड़ा, उच्च-गुणवत्ता वाला डेटासेट एकत्र करते हैं, मानव-पसंदीदा सारांश की भविष्यवाणी करने के लिए एक मॉडल को प्रशिक्षित करते हैं, और सुदृढीकरण सीखने का उपयोग करके सारांश नीति को ठीक करने के लिए उस मॉडल को एक पुरस्कार फ़ंक्शन के रूप में उपयोग करते हैं।

ChatGPT की सीमाएँ क्या हैं?

विषाक्त प्रतिक्रिया पर सीमाएँ

ChatGPT विशेष रूप से विषाक्त या हानिकारक प्रतिक्रियाएँ प्रदान न करने के लिए प्रोग्राम किया गया है। इसलिए यह इस प्रकार के प्रश्नों का उत्तर देने से बच जाएगा।

उत्तरों की गुणवत्ता निर्देशों की गुणवत्ता पर निर्भर करती है

ChatGPT की एक महत्वपूर्ण सीमा यह है कि आउटपुट की गुणवत्ता इनपुट की गुणवत्ता पर निर्भर करती है। दूसरे शब्दों में, विशेषज्ञ निर्देश (संकेत) बेहतर उत्तर उत्पन्न करते हैं।

उत्तर हमेशा सही नहीं होते

एक और सीमा यह है कि क्योंकि इसे ऐसे उत्तर प्रदान करने के लिए प्रशिक्षित किया गया है जो मनुष्यों को सही लगते हैं, उत्तर मनुष्य को धोखा दे सकते हैं कि आउटपुट सही है।

कई उपयोगकर्ताओं ने पाया कि ChatGPT गलत उत्तर दे सकता है, जिनमें कुछ बेहद गलत भी हैं।

कोडिंग Q&A वेबसाइट स्टैक ओवरफ़्लो के मॉडरेटरों ने उन उत्तरों के अनपेक्षित परिणाम की खोज की होगी जो मनुष्यों को सही लगते हैं।

स्टैक ओवरफ्लो ChatGPT से उत्पन्न उपयोगकर्ता प्रतिक्रियाओं से भर गया था जो सही प्रतीत होते थे, लेकिन बहुत से गलत उत्तर थे।

हजारों उत्तरों ने स्वयंसेवक मॉडरेटर टीम को अभिभूत कर दिया, जिससे प्रशासकों को ChatGPT से उत्पन्न उत्तर पोस्ट करने वाले किसी भी उपयोगकर्ता के खिलाफ प्रतिबंध लगाने के लिए प्रेरित किया गया।

ChatGPT उत्तरों की बाढ़ के परिणामस्वरूप एक पोस्ट प्रकाशित हुई जिसका शीर्षक था: अस्थायी नीति: ChatGPT प्रतिबंधित है:

“यह एक अस्थायी नीति है जिसका उद्देश्य ChatGPT के साथ बनाए गए उत्तरों और अन्य सामग्री के प्रवाह को धीमा करना है।

...प्राथमिक समस्या यह है कि ChatGPT जो उत्तर देता है उनमें गलत होने की दर अधिक होती है, वे आम तौर पर "ऐसे दिखते हैं" जैसे वे "अच्छे" हो सकते हैं..."

सही दिखने वाले गलत ChatGPT उत्तरों के साथ स्टैक ओवरफ़्लो मॉडरेटर का अनुभव कुछ ऐसा है जिसके बारे में ओपनएआई, ChatGPT के निर्माता, नई तकनीक की अपनी घोषणा में जानते हैं और चेतावनी देते हैं।

ओपनएआई ChatGPT की सीमाएं समझाता है

OpenAI घोषणा ने यह चेतावनी दी:

“ ChatGPT कभी-कभी विश्वसनीय लेकिन गलत या निरर्थक उत्तर लिखता है।

इस समस्या को ठीक करना चुनौतीपूर्ण है, क्योंकि:

(1) आरएल प्रशिक्षण के दौरान, वर्तमान में सत्य का कोई स्रोत नहीं है;

(2) मॉडल को अधिक सतर्क रहने का प्रशिक्षण देने से वह उन प्रश्नों को अस्वीकार कर देता है जिनका वह सही उत्तर दे सकता है; और

(3) पर्यवेक्षित प्रशिक्षण मॉडल को गुमराह करता है क्योंकि आदर्श उत्तर इस बात पर निर्भर करता है कि मॉडल क्या जानता है, न कि मानव प्रदर्शनकारी क्या जानता है।

क्या ChatGPT उपयोग निःशुल्क है?

ChatGPT का उपयोग वर्तमान में "शोध पूर्वावलोकन" समय के दौरान निःशुल्क है।

चैटबॉट वर्तमान में उपयोगकर्ताओं को आज़माने और प्रतिक्रियाओं पर प्रतिक्रिया देने के लिए खुला है ताकि एआई सवालों के जवाब देने और अपनी गलतियों से सीखने में बेहतर हो सके।

आधिकारिक घोषणा में कहा गया है कि OpenAI गलतियों के बारे में प्रतिक्रिया प्राप्त करने के लिए उत्सुक है:

“हालांकि हमने मॉडल को अनुचित अनुरोधों को अस्वीकार करने के लिए प्रयास किए हैं, यह कभी-कभी हानिकारक निर्देशों का जवाब देगा या पक्षपातपूर्ण व्यवहार प्रदर्शित करेगा।

हम कुछ प्रकार की असुरक्षित सामग्री को चेतावनी देने या ब्लॉक करने के लिए मॉडरेशन एपीआई का उपयोग कर रहे हैं, लेकिन हमें उम्मीद है कि अभी इसमें कुछ गलत नकारात्मक और सकारात्मक बातें होंगी।

हम इस प्रणाली को बेहतर बनाने के लिए चल रहे हमारे काम में सहायता के लिए उपयोगकर्ताओं की प्रतिक्रिया एकत्र करने के लिए उत्सुक हैं।

वर्तमान में जनता को प्रतिक्रियाओं का मूल्यांकन करने के लिए प्रोत्साहित करने के लिए ChatGPT क्रेडिट में $500 के पुरस्कार के साथ एक प्रतियोगिता चल रही है।

“उपयोगकर्ताओं को यूआई के माध्यम से समस्याग्रस्त मॉडल आउटपुट के साथ-साथ बाहरी सामग्री फ़िल्टर से झूठी सकारात्मक/नकारात्मकता पर प्रतिक्रिया देने के लिए प्रोत्साहित किया जाता है जो इंटरफ़ेस का भी हिस्सा है।

हम विशेष रूप से हानिकारक आउटपुट के बारे में फीडबैक में रुचि रखते हैं जो वास्तविक दुनिया, गैर-प्रतिकूल परिस्थितियों में हो सकते हैं, साथ ही फीडबैक जो हमें नए जोखिमों और संभावित शमन को उजागर करने और समझने में मदद करता है।

आप एपीआई क्रेडिट में $500 तक जीतने का मौका पाने के लिए ChatGPT फीडबैक प्रतियोगिता3 में भाग लेना चुन सकते हैं।

प्रविष्टियाँ फीडबैक फॉर्म के माध्यम से सबमिट की जा सकती हैं जो ChatGPT इंटरफ़ेस से जुड़ा हुआ है।

वर्तमान में चल रही प्रतियोगिता 31 दिसंबर, 2022 को रात 11:59 बजे पीएसटी पर समाप्त होगी।

संबंधित: ओपनएआई ChatGPT का एक पेड प्रो संस्करण पेश कर सकता है

क्या भाषा मॉडल Google खोज का स्थान ले लेंगे?

Google पहले ही एक AI चैटबॉट बनाया है जिसे LaMDA कहा जाता है। Google के चैटबॉट का प्रदर्शन मानवीय वार्तालाप के इतना करीब था कि एक Google इंजीनियर ने दावा किया कि LaMDA संवेदनशील था।

यह देखते हुए कि ये बड़े भाषा मॉडल इतने सारे सवालों का जवाब कैसे दे सकते हैं, क्या यह दूर की कौड़ी है कि ओपनएआई, Google या माइक्रोसॉफ्ट जैसी कंपनी एक दिन पारंपरिक खोज को एआई चैटबॉट से बदल देगी?

Twitter पर कुछ लोग पहले से ही घोषणा कर रहे हैं कि ChatGPT अगला Google होगा।

यह परिदृश्य कि एक प्रश्न-उत्तर चैटबॉट एक दिन Google की जगह ले सकता है, उन लोगों के लिए भयावह है जो खोज विपणन पेशेवरों के रूप में जीवन यापन करते हैं।

इसने लोकप्रिय FaceBypassGPTook एसईओसिग्नल्स लैब जैसे ऑनलाइन खोज विपणन समुदायों में चर्चाओं को जन्म दिया है, जहां किसी ने पूछा कि क्या खोजें खोज इंजन से हटकर चैटबॉट की ओर जा सकती हैं।

ChatGPT का परीक्षण करने के बाद, मुझे इस बात से सहमत होना होगा कि खोज को चैटबॉट द्वारा प्रतिस्थापित किए जाने का डर निराधार नहीं है।

प्रौद्योगिकी को अभी भी एक लंबा रास्ता तय करना है, लेकिन खोज के लिए हाइब्रिड खोज और चैटबॉट के भविष्य की कल्पना करना संभव है।

लेकिन ChatGPT का वर्तमान कार्यान्वयन एक ऐसा उपकरण प्रतीत होता है, जिसका उपयोग करने के लिए, कुछ बिंदु पर, क्रेडिट की खरीद की आवश्यकता होगी।

ChatGPT उपयोग कैसे किया जा सकता है?

ChatGPT किसी विशिष्ट लेखक की शैली में कोड, कविताएँ, गीत और यहाँ तक कि लघु कहानियाँ भी लिख सकता है।

निम्नलिखित दिशाओं में विशेषज्ञता ChatGPT एक सूचना स्रोत से एक उपकरण तक बढ़ा देती है जिसे किसी कार्य को पूरा करने के लिए कहा जा सकता है।

यह इसे वस्तुतः किसी भी विषय पर निबंध लिखने के लिए उपयोगी बनाता है।

ChatGPT लेखों या यहां तक कि संपूर्ण उपन्यासों की रूपरेखा तैयार करने के लिए एक उपकरण के रूप में कार्य कर सकता है।

यह वस्तुतः किसी भी कार्य के लिए एक प्रतिक्रिया प्रदान करेगा जिसका उत्तर लिखित पाठ के साथ दिया जा सकता है।

निष्कर्ष

जैसा कि पहले उल्लेख किया गया है, ChatGPT कल्पना एक ऐसे उपकरण के रूप में की गई है जिसका उपयोग करने के लिए जनता को अंततः भुगतान करना होगा।

जनता के लिए खोले जाने के बाद पहले पांच दिनों के भीतर ChatGPT का उपयोग करने के लिए दस लाख से अधिक उपयोगकर्ताओं ने पंजीकरण कराया है।

संबंधित लेख

अधिक देखें >>

HIX.AI के साथ AI की शक्ति को अनलॉक करें!