Top OpenAI's ChatGPT נכשל בעת השבת

לפני כמעט 6 חודשים, לטכנולוגית של OpenAI ChatGPT הושקת. למעשה, החברה השקיעה בפניות על חדשה של ChatGPT 4 לאחרונה. הטכנולוגיה הזו הספיקה להביא את העולם לרמה חדשה לגמרי.

ChatGPT הוא מודל שפה המופעל על ידי AI והוכשר לביצוע מגוון פעילויות, כולל תרגום של שפות, סיכום מידע ומענה על שאלות. יכולותיו החריפות של המודל גררו קשה להרבה תשומת לב, וכתוצאה מכך, רבים מתחילים להשתלשל בנוגע להזדמנויות העסקיות שלהם.

הדגם לעיבוד שפה GPT-4 יכול לשמש לנתח כמויות עצומות של נתונים, לאחר מכן הוא יכול ליצור תוכן במבוסס על הממצאים של הניתוח. כמו כן, הטכנולוגיה החדשה מסוגלת לנתח כמויות גדולות של טקסט כדי להציג לצרכנים מידע בנוגע לנקודת נתונים מסוימת.

אין ספק שטכנולוגיה תישאר לאורך זמן. כמובן, היא עוזרת למשתמשים בדרכים רבות. במגוון מקרים היא הוכיחה את יכולתה לבצע הכל, מכתיבת סקריפטים עד פתרון שאלות המקושרות ביותר. אין דבר שג'אטGPT לא יכול להשלים. אף על פי כן, יש דברים שקשה יותר לג'אטGPT לעשות.

1. ה-ChatGPT המופעל על ידי בינה מלאכותית סבל הפסד כשלא הצליח לעבור את מבחן ה- Joint Entrance Examination (JEE) המבוקש בהרהור אחד באינדיה. מבחן ה- Joint Entrance Examination מפורסם בקרב הקשה וממשיך אליו אלפי תלמידים מדי שנה שמעוניינים להיכנס לבתי הספר ההנדסיים המובילים ביישוב. זהו אחד מהבחינות הכמוסות הכי קשות שמכילות תרשימים ומספרים מורכבים.

תלמידים המעוניינים להשתתף במוסדות חינוך מוכרים כמו ה-IIT וה-NIT חייבים לעבור בתחילה את מבחן הכניסה המשותף. על פי הדיווחים, ChatGPT לא התפקד בצורה טובה במבחן הJEE Advanced.

תוצאות ביצועי ה-ChatGPT במבחן היו פחות משביעות רצון, מאחר והיא הצליחה לפתור רק 11 מסה"כ השאלות במסמך.

2. ChatGPT הצליח בעבר במספר מבחנים אחרים שהם גם מובהקים וקשים. באופן מרשים, ChatGPT ניסה וענה בהצלחה על כל 200 שאלות במבחן ההכנסה והאפקטיביות הלאומי לחוג לרפואה (NEET), שמחייב מועמדים לענות על 180 שאלות מתוך סה"כ 200.

למרות זאת, ChatGPT ניסתה את כל השאלות ה-200, ותוצאות הביצוע שלה התקבלו כ-359 מתוך 800. מדויקת יותר, ChatGPT התפצלה בצורה יוצאת דופן ברכיב הביולוגיה של מבחן ה-NEET, הצוברת דיוק טוב יותר בתשובות שלה לשאלות שנשאלו באותו הקטע. הביצועים של ChatGPT במבחן ה-NEET מרמים על כך שיש לה היכולת להצליח בתחומים נוספים, למרות שהיא לא הצליחה במבחן JEE המתקדם.

ההפסד שחווה ChatGPT במבחן JEE Advanced מדגים את ההגבלות שקיימות גם במודלי הלמידה המתקדמים ביותר של AI. אף על פי שלבינה מלאכותית יש את הפוטנציאל לסעיף את תעשיות רבות שונות, היא עדיין רחוקה מלהתערב עם אינטיליגנציה אנושית במשימות קשות.

השיחת בוט של OpenAI, ChatGPT, לא הצליחה במבחן תחרותי נוסף.

3. צ'אט־GPT עבר את מבחן קומיסיה השירות הציבורי הגונר"ל (UPSC) על פי בקשת מגזין Analytics India (AIM). מבחן ה־UPSC מוכר כאחד ממבחני התחרות הקשים ביותר בעולם. יותר מ־10 לקוחות מתמודדים בכל שנה עם מבחן ה־UPSC, אך רק 5% מהם יכולים לעבור אותו.

AIM סיפקה ל-ChatGPT 100 שאלות ממבחן ה-UPSC Prelims 2022.

הצ'אטבוט הצליח גרוע במבחן UPSC Prelims 2022, וקיבל רק 54 מתוך 100 בנייר שאלות 1 (סט A), בזמן שהציון הנדרש היה 87.54. זה מעיד על כך ש-ChatGPT לא עבר את מבחן ה-UPSC.

שאלות היו מבוססות על נושאים במדע הכללי הודי, היסטוריה, גיאוגרפיה, כלכלה, אקולוגיה ואירועים נוכחיים. הרובוט הצליח עם שאלות על מיקומים וכלכלות, אך כשנשאל על אירועים היסטוריים שקרו לפני השנה 2021, נכשל בצורה מזעזעת.

העובדה שמערך הנתונים של ChatGPT מתרחשת רק עד שנת 2021 היא כנראה הגורם המשפיע ביותר על אין האפשרות של הרובוט הבינה המלאכותית לענות נכון על כל שאלות המבחן.

4. בנוסף לכך, תוצאות מבחן הCLAT עבור ChatGPT היו למעלה מהממוצע. במהלך מבחן הCLAT UG, כלי הבינה המלאכותי הצליח רק בפרוש התשובה הנכונה ל-50.83 אחוז מהשאלות. ה-ChatGPT לא הצליח בקטגוריות השאלות הלוגיות והכמותיות. אך, הוא התמודד בצורה מצוינת בקטגוריות השאלות באנגלית ועכשוויות. כשהגיע הזמן לשאלות שמבוססות על רעיונות, כלי זה נאלץ להתמודד בצרה רבה.

שוחרר בנובמבר 2022, ה-ChatGPT מוצא את עצמו באורח חיים מוצלח בארצות הברית. טכנולוגיית הבינה המלאכותית הזו הופיעה בדרך כלל במבחני החזון הרעיוני למועמדים אשר מתקדמים לתואר דוקטור לרפואה בארה"ב, ובנוסף גם בבחינות ה-MBA השונות בארה"ב. יתרה מכך, ה-Coding Interviews של גוגל למהנדסים ברמה 3 התקיימו בהצלחה כראוי.

מקצוענים וטרינריים התפלאו לאחרונה כאשר ChatGPT הצליח לאבחן נכותם בהצלחה ולהציל את חייהם של כלבים.

הרבה מדינות, אולם, מחזיקות נקודות מבט נגדיות כלפי ChatGPT ומוכנות לפעולות מתיסות כנגד החדשנות החדשה. לאחרונה הטכנולוגיה נאסרה בשתי מדינות גדולות, כולל גרמניה ו- איטליה. מדינות אלו טוענות כי ChatGPT של OpenAI חסרת מנשקים המונעים מילדים להיתקל בתוכן יוצא דופן, כגון מערכת אימות גיל.

אולריך קלבר, המפקח על הגנת נתונים של גרמניה, הפיץ אזהרה כי ייתכן וג'אט-גי-פי-טי יחווה איסור בגרמניה עקב דאגות בנושא אבטחת הנתונים של המשתמשים, דומה למה שקרה באיטליה.

נוּסה נוּת בדרך כלל איך טכנולוגיית מולאה חושבת תלמד להתנהג בעתיד.

תודה על הקריאה! נא להישאר מחוברים לעוד מאמרים מועילים כאלה!

חלקת הדיבור של ChatGPT של OpenAI כשלה בתשובת

כתבות קשורות