שחררנו את GPT-4 החדש! מגיע באמצע מרץ 2023

gpt-4-640b66db8c60d-sej-1520x800.jpg

מנהל הטכנולוגיה של Microsoft בגרמניה, אנדריאס בראון, אישר כי GPT-4 מגיע בתוך שבוע לפרק הזמן של 9 במרץ 2023 וכי יהיה לו יכולות מרובות. AI מרובות היכולות משמעותו כי יהיה לו אפשרות לפעול עם סוגים מרובים של קלט, כמו וידאו, תמונות וסאונד.

עדכון: GPT-4 הופץ ב-14 במרץ 2023

OpenAI פרסמו את GPT-4 ב-14 במרץ 2023. זהו מודל רב-מצבי שמקבל שאילתות תמונה וטקסט.

מודאל הוא ביטוי המשמש בלמידת מכונה לציון דרכים שונות של קלט כמו טקסט אך גם תחושות כמו קול, תמונה, ריח ועוד.

ההודעה של OpenAI תיארה את המידה של התקדמות ה-GPT-4:

"...בעוד שהוא פחות מסוגל מבני אדם בהרבה תרחישים בעולם האמיתי, מציג ביצועים ברמה האנושית במגוון בנקודות המידה המקצועיות והאקדמאיות.

לדוגמה, הוא עובר מבחן בר בדמות דירוג בין ה-10% הגבוה ביותר של נבחנים; להבדל, הדירוג של GPT-3.5 היה בסביבה של ה-10% הנמוך ביותר.

הוצבנו 6 חודשים בלימוד האילון של GPT-4 באמצעות שיעורים מתכנית הבדיקות הרבת מרד שלנו וגם מחיפושנו, תוצאתו היא הטובה ביותר שהגענו אליה עד כה (עם הרבה רחק מהמושלמות) בשמירה על העובדות, היכולת לשליטה, והסרתו מחוץ למסלולי העולם."

מודלים שפתיים מרובי כלי ענקיים

הלקיחה המרכזית מההודעה היא ש-GPT-4 הוא מולטימודלי (SEJ חיזתה ש-GPT-4 הוא מולטימודלי בינואר 2023).

הדרך המודאלית היא התייחסות לסוג הקלט (במקרה זה) של מודל שפתי גדול מתמודד בו.

מולטימודליות יכולה לכלול טקסט, דיבור, תמונות ווידאו.

GPT-3 ו-GPT-3.5 פעלו רק במודאליות אחת, טקסט.

לפי דיווח החדשות הגרמני, ה- GPT-4 עשוי להפעיל בעל ארבעה מצבים לפחות, תמונות, קול (שמיעה), טקסט ווידאו.

ד"ר אנדריאס בראון, ה-CFO של מיקרוסופט גרמניה נצטט:

"נביא לך את GPT-4 בשבוע הבא, שם יהיו לנו מודלים מולטימודליים שיציעו אפשרויות שונות לגמרי - לדוגמה וידאו..."

הדיווח היה חסר בפרטים לגבי GPT-4, לכן לא ברור אם מה ששותף בנוגע לרב-מצביות היה ספציפי ל-GPT-4 או רק בכללי.

המנהל לאסטרטגיה עסקית של מיקרוסופט, הולגר קן, הסביר על multimodalities אשר מיוצג באמצעות GPT-4 או multimodality בכלל. אולם, הדיווח אינו ברור לגבי האם הוא התייחס ל-GPT-4 או ל-multimodality בכללות.

אני מאמין שהתייחסותיו לרב-שימושיות היו ספציפיות ל-GPT-4.

הדיווחים מספרים:

“קֵן הסביר את המונח ‘מולטימודליות בבינה מלאכותית’, שיכולה לתרגם טקסט לא רק לדימויים, אלא גם למוזיקה ווידאו”.

עוברות למסגרת אחרת היא העובדה שמיקרוסופט עובדת על "מדדי ביטחון" כדי לשתף את AI שלהם בפיסוק על סמך עובדות כדי להפוך אותו למהימנה יותר.

Microsoft קוסמוס-1

משהו שנדלק כנראה באופן לא מספיק בארצות הברית הוא שמיקרוסופט השיקה מודל שפה מרובת המודלים בשם Kosmos-1 בתחילת מרץ 2023.

על פי הדיווחים של אתר החדשות הגרמני, Heise.de:

“...הצוות ניתח את הדגם שסופר מראש במבחנים שונים, והשיג תוצאות טובות בסיווג תמונות, תשובה על שאלות על תוכן תמונה, תיוג אוטומטי של תמונות, זיהוי טקסט אופטי ומשימות יצירת דיבור.”

…ההיסטורייה, כלומר מסירת מסרים מתמונה למשתמש בלי להשתמש בשפה כשלב אמצעי, כנראה חשובה כאן…

Kosmos-1 היא מודל מרובה מודלים המשלב את המודליות של טקסט ותמונות.

GPT-4 הולך עוד צעד קדימה מ-Kosmos-1 בגלל שהוסיף מודליות שלישית, וידאו, וכן כן נראה שמכיל מודליות של קול.

עובד במגוון שפות

GPT-4 נראה כי עובד בכל השפות. נכתב שהוא מסוגל לקבל שאלה בגרמנית ולענות באיטלקית.

זו דוגמה קצת מוזרה, מי שישאל שאלה בגרמנית וירצה לקבל תשובה באיטלקית?

זהו מה שנאושר:

“...הטכנולוגיה התקדמה כל כך הרבה עד שהיא בעצם "עובדת בכל השפות": ניתן לשאול שאלה בגרמנית ולקבל תשובה באיטלקית.

עם הרב-מצביות, מיקרוסופט (-OpenAI) תגרום למודלים להיות כוללים”.

אני מאמין שנקודת המעבר של הדגם היא שהוא חוצה את שפת התכנים ביכולת שלו למשוך ידע בין שפות שונות. אז אם התשובה באיטלקית, הוא ידע לזהות זאת ולספק את התשובה בשפה שבה נשאל השאלה.

זה יגרום לזה להיות דומה למטרתה של אמצעי הבינה המלאכותית של Google, שנקרא MUM. נאמר על MUM שהיא יכולה לספק תשובות באנגלית לשאלות שהמידע מופיע רק בשפה אחרת, כמו ביפנית.

יישומים של GPT-4

אין הודעה נוכחית על מקום בו ג'יי.פי.טי-4 יופיע. אך Azure-OpenAI צויינה במיוחד.

Google מתמודדת כעת עם קושי להשתוות ל-Microsoft על-ידי שילוב טכנולוגיית תחרות במנוע החיפוש שלה. התפתחות זו מדגישה באופן נוסף את התחושה שגוגל מסתדרת פחות טוב מאיברה המתחרה וחסרת הנהיגה בתחום בינה מלאכותית לצרכנים.

Google כבר משלבת AI במגוון מוצרים כגון Google Lens, Google Maps ותחומים נוספים שבהם הצרכנים מתמודדים עם Google. הגישה הזו היא לנצל את היכולת של AI כטכנולוגיה סיוע, לעזור לאנשים במשימות קטנות.

דרך מיקרוסופט ליישום זה היא יותר נראית ובהתאם מושכת את כל התשומת הלב ומחזקת את הדימוי של גוגל כמותעקשן ומתמודדת בקשיים להצליח להשגיח.

קראו את ההודעה הרשמית על הפרסום של OpenAI GPT-4 כאן.

קראו את הדיווח המקורי בגרמנית כאן:

GPT-4 מגיע שבוע הבא - והוא יהיה מרובה-מצבי, כך אומרת Microsoft גרמניה

כתבות קשורות

הצג עוד >>

פתח את הכוח של AI עם HIX.AI!