פניית U-Turn של OpenAI: לא לאמן את GPT-4 על נתוני לקוחות API

שינויי פרטיות ב-OpenAI-6457d3fd3d25f-sej-760x400.png

בהתפטרות חשובה ממתכונות הקודמות שלה, OpenAI הודיעה כי היא כבר לא תשתמש בנתוני לקוח שנשלחים דרך ה- API שלה כדי לאמן את מודלי השפה המתפשטים שלה, כמו GPT-4.

השינוי אושר על ידי סם אלטמן, המנכ"ל של OpenAI, בראיון אחרון עם CNBC.

הגישה החדשה של OpenAI לנתוני המשתמש

שינוי המדיניות של OpenAI הוכרז ב־1 במרץ 2023, כשהחברה עדכנה בשקט את תנאי השירות שלה כדי לשקף את המחויבות החדשה לפרטיות המשתמשים.

אלטמן הבהיר, "הלקוחות ברור במצב רוחם שאנחנו לא נאמן על הנתונים שלהם, לכן שינינו את התוכניות שלנו: אנחנו לא נעשה זאת."

APIs, או ממשקי תכנות ליישומים, הם שילובי טכנולוגיה המאפשרים ללקוחות להתחבר ישירות לתוכנה של OpenAI.

אלטמן ציינה כי אופןיי לא השתמשו במידע API לשימור הדוגמאות של המודל "מזמן", מרמז על כך שההודעה הרשמית משקפת מועדף קיים.

השפעות על לקוחות העסקיים

הצעת OpenAI משפיעה באופן רחב, במיוחד על לקוחות העסקיים שלה, שמכילים עניינים גדולים כמו Microsoft, Salesforce וSnapchat.

משתמשים באפשרויות ה- API של OpenAI אמורים להשתמש יותר מתאימה בפעולותיהם, לכן השינוי בפרטיות והגנת הנתונים רלוונטי במיוחד בשבילם.

עם זאת, ההוראות החדשות להגנת הנתונים חלות רק על לקוחות המשתמשים בשירותי ה- API של החברה. עפ"י תנאי השירות המעודכנים של OpenAI, מסומן: "יתכן שנעשה שימוש בתוכן משירותים אחרים מלבד ה- API שלנו".

ככל שכן, ניתן עדיין להשתמש בצורות אחרות של קלטי נתונים, כמו טקסט שהוזן לתוך הצ'אטבוט הפופולרי ChatGPT, אלא אם הנתונים משותפים דרך ה- API.

השפעה נרחבת על התעשייה

שינוי המדיניות של OpenAI מתרחש כאשר התעשיות מתמודדות עם ההשפעות הפוטנציאליות של מודלי שפה גדולים, כמו ChatGPT של OpenAI, שמחליפים חומר שנוצר לעתים על ידי בני אדם.

לדוגמה, מאחר ותיאום בין התאחדות הסופרים של אמריקה וחברות הקולנוע נכשל לאחרונה, התחילה הסוחר הנכונות של התאחדות הסופרים, לאחר שהתחילו בהתפספסות ותהליכים לפני שאפעלו במלואם, בניגוד לשימוש ב-ChatGPT של OpenAI לתכנון או לביצוע שינויים בתסריטים.

החלטת OpenAI שלא להשתמש בנתונים של לקוחות כחלק מתהליך האימון מהווה רגע מרכזי בשיח המתמשך על פרטיות הנתונים והלמידת מכונה. כאשר החברות ממשיכות לחקור ולהרחיב את גבולות טכנולוגיית הלמידה המתמשכת, הבטיחות של המשתמש והתחזקות האמון כנראה יישארו במרכז של הדיונים הללו.

התפתחותו של ChatGPT: GPT-3 אל GPT-4

חשוב לציין שהתחייבותה של OpenAI שלא להשתמש בנתוני לקוח לצורך הכשרה חלה על הדור האחרון של דגם השפה שלה, GPT-4, שיצא ב-14 במרץ 2023.

GPT-4 הכניס מספר שיפורים על המקודם שלו, GPT-3, כולל עליה משמעותית בגודל המגבלת המילים (25,000 לעומת המגבלה של 3,000 מילים של ChatGPT), גודל חלון ההקשר הגדול יותר, ויישור ויכולות חשיבה משופרות.

עוד תכונה מובחנת של GPT-4 היא היותה מרובות קוביות, או ביכולתה להבין ולהבין מידע מתמונות בנוסף לטקסט. הדור העדכני מייצר טקסטים דומים יותר לאדם, תוך השימוש בתכונות כמו סמיילים לחוויה אישית יותר.

אף על פי שגודלו המדויק והארכיטקטורה של GPT-4 נשמרים בסוד, יש דימויות בנוגע לפרטים של המודל.

למרות השמועות האלה, מנכ"ל OpenAI התיחס במניע שח לטענות המסוימות לגבי גודל המודל.

בנוגע לביצועים, GPT-4 הצגה יכולות מוכחות ביצירת טקסט אך גם כמה הגבלות. לדוגמה, היא קיבלה בניקוד מקום ה-54 באחוזים בבחינת הכתיבה של מבחן ה-Graduate Record Examination (GRE) והתקיימה בטווח ה-43-59 באחוזים במבחן ה-AP Calculus BC.

בנוסף, הוא מבריח מצויין על משימות קידוד קלות בליקודק, אך הביצועים שלו ירדו עם הקושי המתמודד.

בעוד הפרטים של תהליך האימון של GPT-4 לא מתועדים באופן רשמי, ידוע שמודלי GPT כוללים בדרך כלל למידת מכונה מסוג גדול ומגוון של טקסטים מהאינטרנט.

בציפייה קדימה

כתוצאה משינויים במדיניות שימוש בנתונים של OpenAI, הנתונים שמשמשים לאימון הדגמים השפה שלהם אינם כוללים מידע ששותף דרך ה- API אלא אם משתמשים מסכימים מפורשות לתרום אותו למטרה זו.

בעוד הטכנולוגיה זו משתפרת ומשחקת תפקיד חשוב יותר בחיינו, מעניין כיצד חברות משנות כיוון ומגיבות לדאגות בנוגע לשמירה על פרטיות המידע ורכיבת האמון של האנשים.

כתבות קשורות

הצג עוד >>

פתח את הכוח של AI עם HIX.AI!