איך לבנות מסייע קולי AI בשפת פייתון באמצעות חיבור ל-OpenAI ChatGPT API

Build-an-AI-Voice-Assistant.png

האם אתה מעוניין לבנות שלך ממשק של לשון מלאכותית? במדריך הזה, אנחנו נראה לך איך לבנות ממשק דיבורי של לשון מלאכותית בשפת פייתון באמצעות ממשק ה-ChatGPT של OpenAI. אנחנו נפרט בכל שורה של קוד, כך שאפילו אם אין לך ידע קודם בנושא של OpenAI, תוכל לעקוב אחרי הדרך.

הגדרת הסביבה

לפני שנחקור את הקוד, עלינו להגדיר את סביבת הפיתוח שלנו עם הכלים הנדרשים. תחילה, נתקין מספר ספריות, כולל Chargpt APA, OpenAI Whisper ו-CoQE TTS text-to-speech. נבנה גם הכול ב-Gradio, כלי ממשק משתמש פשוט-לשימוש שיסייע לנו לבנות את הממשק של היישום שלנו.

מחזיקים הלאה, נגדיר את הדגם של טקסט-אל־קול, דגם של קול-אל־טקסט והמפתח של OpenAI שלנו. נשתמש בספריית ה-Whisper של OpenAI עבור העתקה של קול, ובממשק ה- API של OpenAI עבור השלמות ב-GPT-3.

התקנת ספריות

כדי להתחיל, יהיה עלינו להתקין את הספריות הנדרשות. אנחנו משתמשים בספריית TTS לסינתזת קול לטקסט, וגם ב- Numpy, OpenAI Whisper, Gradio ו- OpenAI.

הבדל

!pip install TTS
!pip install numpy==1.21
!pip install openai==0.10.2
!pip install gradio
!pip install openai_whisper

ייבוא ספריות

לאחר שנתקינו את הספריות, ניבא את כל המודלים הנדרשים. ניבא את Whisperous, Whisper, Gradio, OpenAI ו-TTS. ספריות אלו יסייעו לנו לבנות את הרכיבים השונים של העוזר הקולי המבוסס על AI שלנו.

פִּיתן

יבא whisperous.whisper כ whisper
יבא gradio כ gr
יבא openai.api כ api
יבא TTS

הגדרת דגם הטקסט לדיבור

בשלב הבא, נקבע את דגם ההמרת טקסט לדיבור. נשתמש בספריה TTS כדי לבנות את הדגם. זה יאפשר למסייע הקולי המלאכותי שלנו להמיר טקסט לדיבור.

מסננת עשיית קבצים

# התקן מודל TTS
tts = TTS.TTS()
tts.load_model(engine="tts", lang="he")

הגדרת המודל לשליחת טקסט

גם יהיה צורך להגדיר את הדגם של הדיבור לטקסט. אנו נשתמש בספריה של OpenAI Whisper כדי לבנות את הדגם הזה. זה יאפשר לעזרנו הווילהי ערוץ הקול המלאכותי שלנו להמיר דיבור לטקסט.

csharp

# קביעת Whisper
wh = whisper.Whisper()
wh.init(whisper.DeviceType.GPU, "he-IL")

הגדרת מפתח ה-API של OpenAI

לבסוף, נתקין את מפתח ה-API של OpenAI שלנו. זה יאפשר לנו להשתמש ב-GPT-3 להשלמת שפה.

מֵפָּתֵחַ

# הגדרת מפתח API של OpenAI
api_key = "המפתח_שלך"
api.api_key = api_key

בניית העוזרת הקולית המבוססת על AI

עכשיו שהגדרנו את הסביבה שלנו, אנחנו מוכנים להתחיל לבנות את מסייע הקול המלאכותי שלנו. נשתמש ב-Gradio כדי לבנות את ממשק המשתמש עבור היישום שלנו. זה יאפשר למשתמשים לשאול שאלות ולקבל תשובות ממסייע הקול המלאכותי שלנו.

פִּיְתוֹן (Python)

def generate_response(text):
    # המרת טקסט לדיבור
    audio = tts.get_tts(text, "נקבה")

    # המרת דיבור לטקסט
    text = wh.transcribe(audio, "en-US")

    # יצירת תגובה באמצעות GPT-3
    prompt = "ענה על השאלה הבאה: " + text
    response = api.Completion.create(engine="text-davinci-002", prompt=prompt, max_tokens=1000)

    # המרת התגובה לטקסט
    answer = response.choices[0].text

    # המרת טקסט לדיבור
   

מסקנה

בסיכום, בניית סייעת קול המשתמשת בטכנולוגיית AI שמשתמשת בממשק OpenAI ChatGPT API ושפת תכנות Python היא דרך נהדרת לחקור את הפוטנציאל של טכנולוגיית המודע המלאכותי. עם הספריות והכלים הזמינים, קל להקים סביבת עבודה וליצור סייעת קול אמיתית היכולה לתת תגובה לשאלות המשתמש ולבצע מגוון משימות.

במדריך זה, עברנו דרך תהליך התקנת הסביבה על ידי התקנת הספריות והמודלים הנדרשים. לאחר מכן בנינו את מודלי הטקסט-לדיבור והדיבור-לטקסט והגדרנו את מפתח ה- OpenAI API. לבסוף, השתמשנו ב-Gradio כדי ליצור את ממשק המשתמש של מבצע השומע שלנו באמצעות AI.

במבצע זה, שהוא נקודת התחלה נהדרת, ישנם עוד דרכים רבות לשפר את המסורת המותאמת אישית של העוזר הקולי המבוסס על AI שלך. לדוגמה, ניתן להוסיף יותר פונקציות כגון היכולת לשלוח דואר אלקטרוני, לנגן מוזיקה או לשלוט במכשירים ביתיים חכמים. בנוסף, ניתן לאמן את המודל של AI שלך על תחומים מסוימים או לשפר את דיוקו על ידי כיוון מדויק.

בכללי, לבנות עוזר קולי של AI הוא פרויקט מהנה ומרתק שיכול לספק הרבה ערך למשתמשים. עם עוצמת ה-OpenAI ChatGPT API ופייתון, האפשרויות הן אין סופיות.

שאלות נפוצות

בטוח, הנה כמה שאלות נפוצות שימושיות עבור בניית סיוע קולי של AI ב-Python באמצעות OpenAI ChatGPT API:

שאלה 1: מהו מסייע קולי AI?

A1: מסייע קולי על גבי המוח (AI) הינו תוכנה שמשתמשת בבינה מלאכותית ועיבוד שפה טבעית להתקשות עם משתמשים באמצעות שפת דיבור.

Q2: אילו ספריות נדרשות כדי לבנות מסייע קולי מבוסס AI ב-Python באמצעות חשיבה-GPT API של OpenAI?

A2: ייתכן שתצטרך להתקין ולייבא ספריות כמו Chargpt APA, OpenAI Whisper, CoQE TTS text-to-speech, Gradio ו- Numpy.

שאלה 3: מהו Gradio וכיצד משתמשים בו לבנות שותף קולי לבינה מלאכותית?

A3: גראדיו הוא כלי UI קל לשימוש שניתן להשתמש בו כדי לבנות ממשק משתמש עבור מסענים אותם מביאים. היא מאפשרת למשתמשים לשאול שאלות ולקבל תשובות מהמסען המתואמץ אותו יש.

שאלה 4: איך מגדירים את הדגם של הטקסט-מעשה עבור מסייע קולי של AI?

A4: ניתן להשתמש בספריית TTS בפייתון כדי להגדיר את המודל להמרת טקסט לדיבור עבור עוזר קולי AI שלך.

שאלה 5: איך אתה מגדיר את הדגם של תמלול לטקסט עבור עוזר קולי חכם?

A5: אתה יכול להשתמש בספריית OpenAI Whisper בשפת פייתון כדי להגדיר את הדגם של המרה של פה לטקסט (speech-to-text) עבור הסייעת קולית שלך למודעת המברג.

שאלה 6: איך אני מגדיר את מפתח ה- API של OpenAI עבור עוזר קול AI?

A6: תצטרך להירשם למפתח API של OpenAI ולהגדיר אותו בסביבת הפייתון שלך כדי להשתמש ב-GPT-3 להשלמת שפה.

שאלה 7: האם ניתן להתאים אישית את עוזרת הקול על מנת לבצע משימות ספציפיות?

A7: כן, תוכל להוסיף יכולות למסייע קולי המבוסס על AI כדי לבצע משימות כמו שליחת אימיילים, הפעלת מוזיקה או שליטה על התקני בית חכם.

ש: האם תוכל לשפר את דיוק מסייע הקול המלאכותי של המערכת המחשב?

A8: כן, ניתן להתאים אישית את מודל הלמידה העמוקה עבור תחומים ספציפיים או להשתמש בטכניקות אחרות כדי לשפר את דיוקו.

כתבות קשורות

הצג עוד >>

פתח את הכוח של AI עם HIX.AI!