चैटजीपीटी कैसे काम करता है?

चैटजीपीटी सबसे शानदार नए एआई-संचालित उपकरणों में से एक है, लेकिन पृष्ठभूमि में काम करने वाले एल्गोरिदम वास्तव में 2020 से ऐप्स और सेवाओं की एक पूरी श्रृंखला को शक्ति प्रदान कर रहे हैं। इसलिए यह समझने के लिए कि चैटजीपीटी कैसे काम करता है, हमें अंतर्निहित भाषा के बारे में बात करके शुरुआत करनी होगी इंजन जो इसे शक्ति प्रदान करता है।

चैटजीपीटी में जीपीटी ज्यादातर जीपीटी-3 या जेनरेटिव प्री-प्रशिक्षित ट्रांसफार्मर 3 है, हालांकि जीपीटी-4 अब चैटजीपीटी प्लस ग्राहकों के लिए उपलब्ध है-और शायद जल्द ही अधिक व्यापक हो जाएगा। GPT मॉडल OpenAI (ChatGPT और छवि जनरेटर DALL·E 2 के पीछे की कंपनी) द्वारा विकसित किए गए थे, लेकिन वे बिंग की AI सुविधाओं से लेकर जैस्पर और Copy.ai जैसे लेखन टूल तक सब कुछ शक्ति प्रदान करते हैं। वास्तव में, इस समय उपलब्ध अधिकांश AI टेक्स्ट जनरेटर GPT-3 का उपयोग करते हैं, और संभवतः अगले चरण के रूप में GPT-4 की पेशकश करेंगे।

ChatGPT ने GPT-3 को सुर्खियों में ला दिया क्योंकि इसने AI टेक्स्ट जेनरेटर के साथ इंटरैक्ट करने की प्रक्रिया को सरल और सबसे महत्वपूर्ण रूप से सभी के लिए मुफ़्त बना दिया। साथ ही, यह एक चैटबॉट है और स्मार्टरचाइल्ड के बाद से लोगों ने एक अच्छे चैटबॉट को पसंद किया है।

जबकि GPT-3 और GPT-4 अभी सबसे लोकप्रिय बड़े भाषा मॉडल (LLM) हैं, अगले कुछ वर्षों में, बहुत अधिक प्रतिस्पर्धा होने की संभावना है। उदाहरण के लिए, Google के पास बार्ड है - इसका AI चैटबॉट - जो अपने स्वयं के भाषा इंजन पाथवेज़ लैंग्वेज मॉडल (PaLM 2) द्वारा संचालित है। लेकिन अभी के लिए, OpenAI की पेशकश वास्तविक उद्योग मानक है। यह लोगों के लिए अपना हाथ पाने का सबसे आसान उपकरण है।

तो इसका उत्तर "चैटजीपीटी कैसे काम करता है?" मूल रूप से है: GPT-3 और GPT-4. लेकिन आइए थोड़ा और गहराई से जानें।

चैटजीपीटी क्या है?

ChatGPT OpenAI द्वारा निर्मित एक ऐप है। जीपीटी भाषा मॉडल का उपयोग करके, यह आपके प्रश्नों का उत्तर दे सकता है, कॉपी लिख सकता है, ईमेल का मसौदा तैयार कर सकता है, बातचीत कर सकता है, विभिन्न प्रोग्रामिंग भाषाओं में कोड की व्याख्या कर सकता है, प्राकृतिक भाषा को कोड में अनुवाद कर सकता है, और बहुत कुछ - या कम से कम कोशिश कर सकता है - यह सब प्राकृतिक भाषा के आधार पर आपको इसे खिलाने के लिए प्रेरित करता है। यह एक चैटबॉट है, लेकिन वास्तव में बहुत अच्छा है।

हालाँकि, यदि आप अपने पालतू जानवर के बारे में शेक्सपियरियन सॉनेट लिखना चाहते हैं या कुछ मार्केटिंग ईमेल के लिए विषय पंक्तियों के लिए कुछ विचार प्राप्त करना चाहते हैं, तो इसके साथ खेलना अच्छा है, यह OpenAI के लिए भी अच्छा है। यह वास्तविक उपयोगकर्ताओं से बहुत सारा डेटा प्राप्त करने का एक तरीका है और जीपीटी की शक्ति के लिए एक फैंसी डेमो के रूप में कार्य करता है, जो अन्यथा थोड़ा अस्पष्ट लग सकता है जब तक कि आप मशीन लर्निंग में गहराई से न हों।

अभी, चैटजीपीटी दो जीपीटी मॉडल पेश करता है। डिफ़ॉल्ट, GPT-3.5, कम शक्तिशाली है लेकिन सभी के लिए निःशुल्क उपलब्ध है। अधिक उन्नत GPT-4 चैटजीपीटी प्लस ग्राहकों तक ही सीमित है, और यहां तक कि उन्हें हर दिन सीमित संख्या में प्रश्न ही मिलते हैं।

चैटजीपीटी की एक बड़ी विशेषता यह है कि यह आपके साथ होने वाली बातचीत को याद रख सकता है। इसका मतलब यह है कि आपने उससे पहले जो भी पूछा है, वह उसका संदर्भ प्राप्त कर सकता है और फिर उसका उपयोग आपके साथ अपनी बातचीत को सूचित करने के लिए कर सकता है। आप पुनः कार्य और सुधार के लिए भी पूछ सकते हैं, और यह उस चीज़ का संदर्भ देगा जिस पर आप पहले चर्चा कर रहे थे। यह एआई के साथ बातचीत को वास्तविक आगे-पीछे की तरह महसूस कराता है।

यदि आप वास्तव में इसका अनुभव प्राप्त करना चाहते हैं, तो अभी जाएं और चैटजीपीटी के साथ खेलने में पांच मिनट बिताएं (यह मुफ़्त है!), और फिर यह पढ़ने के लिए वापस आएं कि यह कैसे काम करता है।

चैटजीपीटी कैसे काम करता है?

इस विशाल डेटासेट का उपयोग एक गहन शिक्षण तंत्रिका नेटवर्क बनाने के लिए किया गया था [ ... ] जो मानव मस्तिष्क के अनुरूप बनाया गया था - जिसने चैटजीपीटी को टेक्स्ट डेटा में पैटर्न और रिश्तों को सीखने की अनुमति दी थी [ ... ] यह भविष्यवाणी करते हुए कि किसी भी वाक्य में आगे कौन सा टेक्स्ट आना चाहिए .

चैटजीपीटी आपके संकेत को समझने का प्रयास करके काम करता है और फिर उन शब्दों की श्रृंखला को उगलता है जो भविष्यवाणी करते हैं कि यह आपके प्रश्न का सबसे अच्छा उत्तर देगा, उस डेटा के आधार पर जिस पर इसे प्रशिक्षित किया गया था।

आइये वास्तव में उस प्रशिक्षण के बारे में बात करते हैं। यह एक ऐसी प्रक्रिया है जहां नवोदित एआई को कुछ बुनियादी नियम दिए जाते हैं, और फिर इसे अपने स्वयं के एल्गोरिदम विकसित करने के लिए या तो स्थितियों में रखा जाता है या काम करने के लिए ढेर सारा डेटा दिया जाता है।

GPT-3 को लगभग 500 बिलियन "टोकन" पर प्रशिक्षित किया गया था, जो इसके भाषा मॉडल को अधिक आसानी से अर्थ निर्दिष्ट करने और प्रशंसनीय अनुवर्ती पाठ की भविष्यवाणी करने की अनुमति देता है। कई शब्द एकल टोकन में मैप होते हैं, हालांकि लंबे या अधिक जटिल शब्द अक्सर कई टोकन में टूट जाते हैं। औसतन, टोकन लगभग चार अक्षर लंबे होते हैं। OpenAI GPT-4 की आंतरिक कार्यप्रणाली के बारे में चुप रहा है, लेकिन हम सुरक्षित रूप से मान सकते हैं कि इसे उसी डेटासेट पर प्रशिक्षित किया गया था क्योंकि यह और भी अधिक शक्तिशाली है।

सभी टोकन मनुष्यों द्वारा लिखे गए डेटा के विशाल भंडार से आए हैं। इसमें सभी अलग-अलग विषयों, शैलियों और शैलियों की किताबें, लेख और अन्य दस्तावेज़ शामिल हैं - और खुले इंटरनेट से अविश्वसनीय मात्रा में सामग्री भी शामिल है। मूल रूप से, इसे मानव ज्ञान के कुल योग को खंगालने की अनुमति दी गई थी।

इस विशाल डेटासेट का उपयोग एक गहन शिक्षण तंत्रिका नेटवर्क बनाने के लिए किया गया था - मानव मस्तिष्क के बाद तैयार किया गया एक जटिल, कई-स्तरित, भारित एल्गोरिदम - जिसने चैटजीपीटी को पाठ डेटा में पैटर्न और संबंधों को सीखने और मानव-जैसा बनाने की क्षमता में टैप करने की अनुमति दी। किसी दिए गए वाक्य में आगे कौन सा पाठ आना चाहिए इसकी भविष्यवाणी करके प्रतिक्रियाएँ।

हालाँकि वास्तव में, इससे चीज़ें बड़े पैमाने पर कम बिकती हैं। चैटजीपीटी वाक्य स्तर पर काम नहीं करता है - इसके बजाय, यह उन शब्दों, वाक्यों और यहां तक कि पैराग्राफ या छंदों का पाठ तैयार कर रहा है। यह आपके फ़ोन पर अगले शब्द का अनुमान लगाने वाला पूर्वानुमानित पाठ नहीं है; यह किसी भी संकेत पर पूरी तरह सुसंगत प्रतिक्रियाएँ बनाने का प्रयास कर रहा है।

विभिन्न प्रकार के विभिन्न संकेतों पर प्रतिक्रिया देने की चैटजीपीटी की क्षमता को और अधिक परिष्कृत करने के लिए, इसे मानव प्रतिक्रिया (आरएलएचएफ) के साथ सुदृढीकरण सीखने नामक तकनीक के साथ संवाद के लिए अनुकूलित किया गया था। अनिवार्य रूप से, मनुष्यों ने तुलनात्मक डेटा के साथ एक इनाम मॉडल बनाया (जहां दो या दो से अधिक मॉडल प्रतिक्रियाओं को एआई प्रशिक्षकों द्वारा रैंक किया गया था), ताकि एआई सीख सके कि सबसे अच्छी प्रतिक्रिया कौन सी थी।

इसके द्वारा गठित तंत्रिका नेटवर्क पर वापस जाएँ। उस सभी प्रशिक्षण के आधार पर, GPT-3 के तंत्रिका नेटवर्क में 175 बिलियन पैरामीटर या चर हैं जो इसे एक इनपुट लेने की अनुमति देते हैं - आपका संकेत - और फिर, विभिन्न मापदंडों (और थोड़ी मात्रा में यादृच्छिकता) को दिए जाने वाले मूल्यों और भार के आधार पर ), वह आउटपुट देता है जो उसे लगता है कि आपके अनुरोध से सबसे अच्छा मेल खाता है। OpenAI ने यह नहीं बताया है कि GPT-4 में कितने पैरामीटर हैं, लेकिन यह एक सुरक्षित अनुमान है कि यह 175 बिलियन से अधिक है और एक बार अफवाह वाले 100 ट्रिलियन पैरामीटर से कम है। सटीक संख्या के बावजूद, अधिक पैरामीटर का मतलब स्वचालित रूप से बेहतर नहीं है। GPT-4 की कुछ बढ़ी हुई शक्ति संभवतः GPT-3 की तुलना में अधिक पैरामीटर होने के कारण आती है, लेकिन संभवतः इसे प्रशिक्षित करने के तरीके में सुधार के कारण बहुत कुछ हुआ है।

अंत में, इसकी कल्पना करने का सबसे सरल तरीका उन "वाक्य समाप्त करें" खेलों में से एक जैसा है जो आपने बचपन में खेला था।

अंत में, इसकी कल्पना करने का सबसे सरल तरीका उन "वाक्य समाप्त करें" खेलों में से एक जैसा है जो आपने बचपन में खेला था। उदाहरण के लिए, जब मैंने GPT-3 का उपयोग करके ChatGPT को प्रॉम्प्ट दिया, "ज़ैपियर है..." तो उसने यह कहते हुए प्रतिक्रिया दी:

"ज़ैपियर एक वेब-आधारित स्वचालन उपकरण है जो उपयोगकर्ताओं को दोहराए जाने वाले कार्यों को स्वचालित करने और वर्कफ़्लो में सुधार करने के लिए विभिन्न वेब अनुप्रयोगों को एक साथ जोड़ने की अनुमति देता है।"

जैपियर क्या करता है, इसका वर्णन करने वाले सैकड़ों लेखों में आप इस तरह का वाक्य पा सकते हैं, इसलिए यह समझ में आता है कि यह उस तरह की चीज है जिसे वह यहां उगलता है। लेकिन जब मेरे संपादक ने उसे वही संकेत दिया, तो उसने कहा:

"ज़ैपियर एक वेब-आधारित स्वचालन उपकरण है जो उपयोगकर्ताओं को विभिन्न वेब अनुप्रयोगों को जोड़ने और उनके बीच वर्कफ़्लो को स्वचालित करने की अनुमति देता है।"

यह काफी हद तक समान है, लेकिन यह बिल्कुल वैसी ही प्रतिक्रिया नहीं है। वह यादृच्छिकता (जिसे आप कुछ GPT-3 ऐप्स में "तापमान" नामक सेटिंग के साथ नियंत्रित कर सकते हैं) यह सुनिश्चित करती है कि ChatGPT हर एक प्रतिक्रिया का जवाब केवल स्टॉक उत्तर के बराबर नहीं दे रहा है। यह हर बार पूरे तंत्रिका नेटवर्क के माध्यम से प्रत्येक प्रॉम्प्ट चला रहा है, और चीजों को ताजा रखने के लिए यहां और वहां कुछ पासे घुमा रहा है। यह दावा करना शुरू करने की संभावना नहीं है कि जैपियर मंगल ग्रह का एक रंग है, लेकिन यह उनकी सापेक्ष संभावनाओं के आधार पर निम्नलिखित शब्दों को मिला देगा।

(इसके लायक होने के लिए, GPT-4 पर चलते समय, ChatGPT ने कहा: " ज़ैपियर एक वेब-आधारित स्वचालन उपकरण है जो उपयोगकर्ताओं को विभिन्न ऑनलाइन अनुप्रयोगों और सेवाओं के बीच कार्यों को एकीकृत और स्वचालित करने की अनुमति देता है।" काफी हद तक वही!)

शब्द उगल रहे हैं, ज्ञान नहीं

चैटजीपीटी के निर्माता यह कहने वाले पहले व्यक्ति हैं कि यह गलत (और संभवतः हानिकारक) जानकारी उत्पन्न कर सकता है, हालांकि वे इसे ठीक करने के लिए कड़ी मेहनत कर रहे हैं।

यहाँ एक विनम्र उदाहरण है. जब मैंने चैटजीपीटी से जीपीटी-3 और जीपीटी-4 का उपयोग करते हुए "हैरी गिनीज है..." का उत्तर देने के लिए कहा, तो जीपीटी-3 ने सबसे पहले यह पूछकर उत्तर दिया कि कौन सा हैरी गिनीज है। महान प्रश्न—वस्तुतः हम दो हैं! तो मैंने कहा, "हैरी गिनीज लेखक" (वह मैं हूं)। GPT-4 ने तुरंत अनुमान लगा लिया कि मैं कौन था, हालाँकि दोनों प्रतिक्रियाएँ आकर्षक थीं:

GPT-3: हैरी गिनीज आयरलैंड में स्थित एक स्वतंत्र लेखक और पत्रकार हैं। उन्होंने द न्यूयॉर्क टाइम्स, द गार्जियन, द हफिंगटन पोस्ट और पॉपुलर मैकेनिक्स सहित कई प्रकाशनों के लिए लिखा है। वह प्रौद्योगिकी और फोटोग्राफी से लेकर यात्रा और संस्कृति तक के विषयों को कवर करते हैं।

जीपीटी-4: हैरी गिनीज़ एक आयरिश लेखक, फ़ोटोग्राफ़र और प्रौद्योगिकी विशेषज्ञ हैं। उन्होंने हाउ-टू गीक, लाइफहैकर और टट्स+ सहित विभिन्न प्रकाशनों के लिए लिखा है। उनका काम मुख्य रूप से प्रौद्योगिकी, ट्यूटोरियल और युक्तियों के साथ-साथ फोटोग्राफी और छवि संपादन पर केंद्रित है। गिनीज ने विस्तृत मार्गदर्शिकाएँ बनाने के लिए प्रतिष्ठा बनाई है जो पाठकों को जटिल विषयों को समझने या समस्याओं को सीधे तरीके से हल करने में मदद करती है।

GPT-3 की पहली और आखिरी पंक्तियाँ लगभग शब्दशः मेरी विभिन्न वेबसाइटों और वेब पर लेखक बायोस से ली गई हैं (हालाँकि मैं आमतौर पर खुद को एक स्वतंत्र लेखक और फोटोग्राफर के रूप में सूचीबद्ध करता हूँ, पत्रकार के रूप में नहीं)। लेकिन प्रकाशनों की सूची मूलतः बनी हुई है। मैंने द न्यूयॉर्क टाइम्स के लिए लिखा है, लेकिन द गार्जियन , द हफिंगटन पोस्ट या पॉपुलर मैकेनिक्स के लिए नहीं (मैं पॉपुलर साइंस के लिए नियमित रूप से लिखता हूं, इसलिए हो सकता है कि वह यहीं से आया हो)।

GPT-4 फ़ोटोग्राफ़र के हिस्से को सही बनाता है और वास्तव में कुछ प्रकाशनों को सूचीबद्ध करता है जिनके लिए मैंने लिखा है, जो प्रभावशाली है, हालांकि वे वे नहीं हैं जिन पर मुझे सबसे अधिक गर्व होगा। यह इस बात का एक बेहतरीन उदाहरण है कि कैसे OpenAI GPT-3 के सापेक्ष GPT-4 की सटीकता को बढ़ाने में सक्षम है, हालांकि यह हमेशा सबसे सही उत्तर नहीं दे सकता है।

लेकिन आइए GPT-3 पर वापस जाएं क्योंकि इसकी त्रुटि ChatGPT में पर्दे के पीछे क्या चल रहा है इसका एक दिलचस्प उदाहरण प्रदान करती है। असल में यह मेरे बारे में कुछ भी नहीं जानता। यह इंटरनेट से कॉपी/पेस्ट करना और सूचना के स्रोत पर भरोसा करना भी नहीं है। इसके बजाय, यह केवल शब्दों की एक श्रृंखला की भविष्यवाणी कर रहा है जो इसके अरबों डेटा बिंदुओं के आधार पर आगे आएगी।

उदाहरण के लिए: न्यूयॉर्क टाइम्स को द गार्जियन और द हफिंगटन पोस्ट के साथ उन स्थानों की तुलना में अधिक बार समूहीकृत किया जाता है, जिनके लिए मैंने लिखा है, जैसे वायर्ड , आउटसाइड , द आयरिश टाइम्स और, निश्चित रूप से, जैपियर। इसलिए जब उसे यह तय करना होता है कि न्यूयॉर्क टाइम्स से क्या आगे बढ़ना चाहिए, तो वह मेरे बारे में प्रकाशित जानकारी से नहीं लेता है; यह अपने पास मौजूद सभी प्रशिक्षण डेटा से बड़े प्रकाशनों की सूची निकालता है। यह बहुत चतुर है और प्रशंसनीय लगता है, लेकिन यह सच नहीं है।

GPT-4 बहुत बेहतर काम करता है और प्रकाशनों को बेहतर बनाता है, लेकिन बाकी जो कुछ भी यह कहता है वह वास्तव में प्रशंसनीय अनुवर्ती वाक्यों जैसा लगता है। मुझे नहीं लगता कि इसमें मेरी प्रतिष्ठा के लिए कोई बड़ी सराहना है: यह बस उस तरह की बात कह रहा है जैसा कि एक जीवनी में कहा गया है। जीपीटी-3 की तुलना में यह छिपाने में कहीं बेहतर है कि यह कैसे काम करता है, हालांकि यह वास्तव में उसी तकनीक का उपयोग करता है।

फिर भी, यह बहुत प्रभावशाली है कि GPT में पहले से कितना सुधार हुआ है। अभी के लिए, GPT-4 एक प्रीमियम सदस्यता के पीछे बंद है, इसलिए आपके द्वारा देखी जाने वाली अधिकांश ChatGPT सामग्री GPT-3 पर निर्भर होगी, लेकिन यह अगले कुछ समय में बदल सकती है। कौन जानता है कि GPT-5 क्या लाएगा।

चैटजीपीटी एपीआई क्या है?

OpenAI का अपनी तकनीक के साथ न्यायपूर्ण रवैया नहीं है। कंपनी के पास एक एपीआई प्लेटफ़ॉर्म है जो डेवलपर्स को चैटजीपीटी की शक्ति को अपने स्वयं के ऐप्स और सेवाओं में एकीकृत करने की अनुमति देता है (निश्चित रूप से कीमत के लिए)।

जैपियर अपने स्वयं के चैटजीपीटी एकीकरण को सशक्त बनाने के लिए चैटजीपीटी एपीआई का उपयोग करता है, जो आपको चैटजीपीटी को हजारों अन्य ऐप्स से कनेक्ट करने और आपके व्यवसाय-महत्वपूर्ण वर्कफ़्लो में एआई जोड़ने की सुविधा देता है। आरंभ करने के लिए यहां कुछ उदाहरण दिए गए हैं, लेकिन आप मूल रूप से किसी भी ऐप से चैटजीपीटी को ट्रिगर कर सकते हैं।

आप जैपियर के OpenAI एकीकरण के साथ OpenAI के अन्य मॉडलों-जैसे DALL·E और Whisper- का भी उपयोग कर सकते हैं। स्वचालित वर्कफ़्लो जिसमें छवि निर्माण और ऑडियो ट्रांसक्रिप्शन शामिल है, सीधे उन ऐप्स से जिनका आप पहले से उपयोग कर रहे हैं।

संबंधित पढ़ना: आप मार्केटिंग कॉपी लिखने के लिए चैटजीपीटी का उपयोग कैसे कर सकते हैं (और आपको कब नहीं करना चाहिए)।

चैटजीपीटी कैसे काम करता है?

चैटजीपीटी क्या है?

चैटजीपीटी कैसे काम करता है?

शब्द उगल रहे हैं, ज्ञान नहीं

चैटजीपीटी एपीआई क्या है?

संबंधित लेख