![תמונת-מסך-2023-03-14-בשעה-13-13-41-אחה.jpg](https://static-lib.s3.amazonaws.com/cms/screenshot_2023_03_14_at_1_13_41_pm_da5958b43b.jpg)
יכולות מתקדמות של ChatGPT, כגון איתור שגיאות בקוד, כתיבת מסה או התחכמות, גרמו לפופולריות הגדולה שלו. למרות יכולותיו, העזרה שלו הוגבלה לטקסט - אך זה עומד להשתנות.
ביום שלישי חשפה OpenAI את GPT-4, מודל מולטימודלי גדול שמקבל קלטים טקסטואליים ותמונות ומחזיר קלט טקסטואלי.
גם: כיצד לגרום ל-ChatGPT לספק מקורות וציטוטים
ההבדל בין GPT-3.5 ל- GPT-4 יהיה "עדין" בשיחה לא רשמית. אולם, הדגם החדש יהיה הרבה יותר מסוגל בנוגע לאמינות, יצירתיות ואף אובחנה.
לפי OpenAI, GPT-4 קיבל ציון בטופ 10% במבחן בר סימולציוני, בעוד ש-GPT-3.5 קיבל כערך בטופ 10% התחתון. גם במבחנים בנוסף, GPT-4 התפרט מעל GPT-3.5 לפי התרשים שמופיע למטה.
![תמונת-מסך-2023-03-14-אחרי-הצהריים-1-40-32-אחר-הצהריים.jpg](https://static-lib.s3.amazonaws.com/cms/screenshot_2023_03_14_at_1_40_32_pm_c7577ae6e4.jpg)
להבנה מעמיקה, ChatGPT פועל על מודל שנטול מבוסס שפה מהסדרה 3.5, שמגביל את הצ'אטבוט לפלט בטקסט בלבד.
ההכרזה החדשה של OpenAI על GPT-4 עקבה אחרי נאומו של אנדריאס בראון, ה-CTO של Microsoft Germany, בשבוע שעבר, שבו הוא אמר ש-GPT-4 יגיע בקרוב ויאפשר אפשרות של יצירת טקסט-וידאו.
"נכנסים לכם את GPT-4 בשבוע הבא; שם יהיו לנו מודלים מולטימודליים שיקדימו אפשרויות שונות לגמרי -- לדוגמה, סרטונים," אמר בראון על פי Heise, פלטפורמת חדשות גרמנית, באירוע.
על-מרות ש-GPT-4 היא מולטימודל, טענת המחולל טקסט לווידאו הייתה מעט לא נכונה. המודל עדיין לא יכול ליצר וידאו בדיוק, אך הוא יכול לקבל קלטים חזותיים, שהם שינוי מהותי מהמודל הקודם.
אחד מהדוגמאות שסיפקה OpenAI כדי להציג את תכונה זו מראה את ChatGPT סורק את התמונה בניסיון להבין מה בדיוק בתמונה היה מצחיק, על פי הקלט של המשתמש.
![תמונת-מסך-2023-03-14-בשעה-1-36-02-אחר-הצהריים.jpg](https://static-lib.s3.amazonaws.com/cms/screenshot_2023_03_14_at_1_36_02_pm_af3a113b01.jpg)
דוגמאות נוספות כוללות העלאת תמונה של גרף ושאילתה מ-GPT-4 לבצע חישובים ממנה או העלאת דף עבודה ושאילתה אליו לפתור את השאלות.
גם: 5 דרכים שבהן ChatGPT יכול לעזור לך בכתיבת מסה
אופן איי מציינת כי היא תשחרר את יכולת הקלט הטקסטואלית של GPT-4 דרך ChatGPT וממשק ה-API שלה דרך רשימת ההמתנה. עליך להמתין עוד קצת ליכולת הקלט של תמונה מאחר ו-OpenAI שותפה עם שותף אחד להתחיל את התהליך הזה.
אם אתה מתאכזב מחוסר מחולל טקסט לוידאו, אל דאגה, זה לא מושג חדש לגמרי. ענקי הטכנולוגיה כמו מטא וגוגל כבר בעלים מודלים בעבודה. למטא יש את Make-A-Video ולגוגל יש Imagen Video, ששניהם משתמשים בהבנת מלאכות לייצור וידאו מקלט ממשתמשים.