Python का उपयोग करके OpenAI ChatGPT API का उपयोग करके एक AI वॉयस असिस्टेंट कैसे बनाएँ

<चित्र><तस्वीर src="https://static-lib.s3.amazonaws.com/cms/Build_an_AI_Voice_Assistant_5df851500e.png" alt="एक-एक-आई-वॉयस-असिस्टेंट.png">

क्या आप अपने खुद के AI आवाज सहायक को बनाने में रुचि रखते हैं? इस ट्यूटोरियल में, हम आपको बताएंगे कि कैसे OpenAI ChatGPT API का उपयोग करके Python में AI आवाज सहायक को कैसे बनाएं। हम हर लाइन पर चलेंगे, कोड, तो यदि आप OpenAI के बारे में पूरा नहीं जानते हैं, तो भी आप काम में जुड़ सकते हैं।

पर्यावरण स्थापित करना

कोड में खेदा जाने से पहले, हमें उपयुक्त उपकरणों के साथ अपने पर्यावरण को सेट करने की आवश्यकता होती है। पहले, हम कई पुस्तकालयों को स्थापित करेंगे, जिनमें चार्जप्ट एपीए, OpenAI Whisper और CoQE TTS पाठ-बोली शामिल हैं। हम अपने ऐप्लिकेशन के लिए इंटरफ़ेस बनाने में हमारी मदद करने वाले Gradio में भी सब कुछ बनाएंगे।

अगले कदम में हम पाठआपक्ष-से-बोलते-करें मॉडल, बोलते-से-पाठ मॉडल, और हमारी OpenAI कुंजी सेट करेंगे। हम आवाज ट्रांसक्रिप्शन के लिए OpenAI Whisper पुस्तकालय और GPT-3 पूर्णता के लिए OpenAI API का उपयोग करेंगे।

पुस्तकालयों का स्थापना करना

शुरू करने के लिए, हमें आवश्यक पुस्तकालय स्थापित करने की जरूरत होगी। हम TTS का उपयोग कर रहे हैं, एक पाठ-से-वॉइस के लिए पुस्तकालय, साथ ही Numpy, OpenAI Whisper, Gradio, और OpenAI का उपयोग कर रहे हैं।

अंतर

!pip install TTS
!pip install numpy==1.21
!pip install openai==0.10.2
!pip install gradio
!pip install openai_whisper

पुस्तकालयों का आयात करना

जब हमने पुस्तकालय स्थापित कर लिया होगा, हम सभी आवश्यक मॉडल आयात करेंगे। हम Whisperous, Whisper, Gradio, OpenAI और TTS को आयात करेंगे। ये पुस्तकालय हमें हमारे AI आवाज सहायक के विभिन्न घटक निर्माण में मदद करेंगे।

पायथन

व्हिस्परस.व्हिस्पर को व्यापारिक नाम whisper के रूप में आयोजित करें 
ग्राडियो को व्यापारिक नाम gr के रूप में आयोजित करें
ओपनएआई.एपीआई को व्यापारिक नाम एपीआई के रूप में आयोजित करें
टीटीएस को व्यापारिक नाम टीटीएस के रूप में आयोजित करें

टेक्स्ट-टू-स्पीच मॉडल सेटअप करना

अगले, हम पाठ-से-ध्वनि मॉडल सेट अप करेंगे। हम मॉडल बनाने के लिए TTS पुस्तकालय का उपयोग करेंगे। इससे हमारे AI आवाज सहायक को पाठ को ध्वनि में बदलने की अनुमति मिलेगी।

मेकफाइल

 # टीटीएस मॉडल सेटअप करें
tts = TTS.TTS()
tts.load_model(engine="tts", lang="hi")

वाक्-से-लिखित मॉडल सेटअप करना

हमें भाषा-से-पाठ मॉडल भी सेट करने की जरूरत होगी। हम इस मॉडल को बनाने के लिए OpenAI Whisper पुस्तकालय का उपयोग करेंगे। इससे हमारे AI आवाज सहायक को बोलचाल को पाठ में बदलने की अनुमति मिलेगी।

csharp

# व्हिस्पर सेटअप करें
डब्ल्यूएच = व्हिस्पर.व्हिस्पर()
डब्ल्यूएच.इनिट(व्हिस्पर.डिवाइसटाइप.जीपीयू, "अप"-"एन-यूएस")

ओपनएआई एपीआई की सेटअप करना

अंत में, हम अपनी OpenAI API कुंजी सेटअप करेंगे। इससे हमें भाषा पूर्ति के लिए GPT-3 का उपयोग करने की अनुमति मिलेगी।

मेकफ़ाइल

# ओपनएआई एपीआई कुंजी सेट करें
api_key = "आपकी_एपीआई_कुंजी"
api.api_key = api_key

AI वॉइस असिस्टेंट बनाना

अब जब हमने अपने वातावरण को सेटअप कर लिया है, हम अपने AI आवाज सहायक को बनाना शुरू करने के लिए तैयार हैं। हम अपने एप्लिकेशन के लिए उपयोग करेंगे Gradio को। इससे उपयोगकर्ताओं को सवाल पूछने और हमारे AI आवाज सहायक से उत्तर प्राप्त करने की अनुमति मिलेगी।

पायथन

def generate_response(पाठ):
    # पाठ को ध्वनि में रूपांतरित करें
    ऑडियो = tts.get_tts(पाठ, "महिला")

    # ध्वनि को पाठ में रूपांतरित करें
    पाठ = wh.transcribe(ऑडियो, "en-US")

    # GPT-3 का उपयोग करके प्रतिक्रिया उत्पन्न करें
    प्रॉम्प्ट = "निम्नलिखित सवाल का उत्तर दें: " + पाठ
    प्रतिसाद = api.Completion.create(engine="text-davinci-002", prompt=प्रॉम्प्ट, max_tokens=1000)

    # प्रतिसाद को पाठ में रूपांतरित करें
    उत्तर = प्रतिसाद.choices[0].text

    # पाठ को ध्वनि में रूपांतरित करें

निष्कर्ष

सारांश में, OpenAI ChatGPT API और Python का उपयोग करके एक AI आवाज सहायक का निर्माण करना एक महान तरीका है AI प्रौद्योगिकी की क्षमता की खोज करने का। उपलब्ध पुस्तकालयों और उपकरणों के साथ, एक वातावरण स्थापित करना और उपयोगकर्ता प्रश्नों का उत्तर देने और विभिन्न कार्यों को करने की क्षमता रखने वाला AI आवाज सहायक बनाना आसान है।

इस ट्यूटोरियल में, हमने आवश्यक पुस्तकालयों और मॉडल्स की स्थापना करने की प्रक्रिया को देखा। फिर हमने टेक्स्ट-टू-स्पीच और स्पीच-टू-टेक्स्ट मॉडल बनाए और ओपनएआई एपीआई कुंजी को सेटअप किया। अंत में, हमने हमारे एआई वॉयस सहायता के लिए उपयोगकर्ता इंटरफेस बनाने के लिए ग्रेडियो का उपयोग किया।

यह ट्यूटोरियल एक बढ़िया शुरुआती बिंदु है, लेकिन आपके एआई आवाज सहायक को सुधारने और अनुकूलित करने के कई और तरीके हैं। उदाहरण के लिए, आप अधिक कार्यक्षमता जोड़ सकते हैं जैसे कि ईमेल भेजने, संगीत चलाने या स्मार्ट होम उपकरणों को नियंत्रित करने की क्षमता। इसके अलावा, आप अपने एआई मॉडल को विशेष डोमेन पर प्रशिक्षित कर सकते हैं या इसकी सटीकता को फाइन-ट्यूनिंग द्वारा सुधार सकते हैं।

समग्र रूप से, एक AI आवाज सहायक बनाना एक मजेदार और मनोरंजक परियोजना है जो उपयोगकर्ताओं को बहुत सारे मान्यता दे सकती है। OpenAI ChatGPT API और Python की शक्ति के साथ, संभावनाएं असीम हैं।

पूछे जाने वाले सवाल

जरूर, यहां Python का उपयोग करके OpenAI ChatGPT API का उपयोग करके AI आवाज सहायक बनाने के लिए कुछ उपयोगी FAQ हैं:

प्रश्न 1: AI आवाज सहायक क्या होता है?

A1: एक AI आवाज सहायक एक सॉफ़्टवेयर प्रोग्राम होता है जो कृत्रिम बुद्धिमत्ता और प्राकृतिक भाषा प्रसंस्करण का उपयोग करके उपयोगकर्ताओं के साथ मौखिक भाषा के माध्यम से बातचीत करने के लिए उपयोग करता है।

२: Python में OpenAI ChatGPT API का उपयोग करके एक एआई ध्वनि सहायक का निर्माण करने के लिए कौन-कौन सी पुस्तकालयें चाहिए?

A2: आपको Chargpt APA, OpenAI Whisper, CoQE TTS text-to-speech, Gradio और Numpy जैसी पुस्तकालयों को स्थापित और आयात करने की जरूरत होगी।

Q3: ग्राडियो क्या है और एक एआई आवाज सहायक बनाने में इसका उपयोग कैसे किया जाता है?

ए3: Gradio एक आसान उपयोग युक्ति उपकरण है जो आपको आपके ए आई आवाज सहायक के लिए उपयोग किया जा सकता है। इसके द्वारा उपयोगकर्ताओं को प्रश्न पूछने और ए आई आवाज सहायक से उत्तर प्राप्त करने की अनुमति है।

Q4: एक AI आवाज सहायक के लिए टेक्स्ट-टू-स्पीच मॉडल को कैसे सेट अप करें?

ए4: आप अपने एआई आवाज सहायक के लिए पायथन में TTS पुस्तकालय का उपयोग कर सकते हैं, ताकि आप टेक्स्ट से स्पीच मॉडल सेटअप कर सकें।

Q5: एक AI आवाज सहायक के लिए भाषा के अनुसार पाठ-टू-वाणी मॉडल को कैसे सेट करते हैं?

A5: आप अपने एआई आवाज सहायक के लिए स्पीच-टू-टेक्स्ट मॉडल सेट करने के लिए पायथन में ओपनएआई व्हिस्पर पुस्तकालय का उपयोग कर सकते हैं।

Q6: एक AI आवाज सहायक के लिए OpenAI API कुंजी को कैसे सेट करें?

A6: भाषा पूर्ति के लिए GPT-3 का उपयोग करने के लिए, आपको एक OpenAI API कुंजी के लिए साइन अप करना होगा और इसे अपने Python पर्यावरण में सेट अप करना होगा।

Q7: क्या आप AI आवाज सहायक को विशिष्ट कार्य करने के लिए अनुकूलित कर सकते हैं?

A7: हां, आप एआई आवाज सहायक में कार्यक्षमता जोड़ सकते हैं जैसे कि ईमेल भेजना, संगीत बजाना या स्मार्ट होम उपकरणों का नियंत्रण करना।

Q8: क्या आप एआई आवाज सहायक की सटीकता में सुधार कर सकते हैं?

A8: हाँ, आप विशिष्ट डोमेन्स पर एआई मॉडल को सामरिक बना सकते हैं या इसकी सटिकता में सुधार करने के लिए अन्य तकनीकों का उपयोग कर सकते हैं।

कैसे ओपनएआई चैटजीपीटी एपीआई का उपयोग करके पायथन में एक एआई वॉयस सहायक बनाएं