מודלי השפה הגדולים כובשים את עולם הפיתוח – אבל עם הכוח הרב שלהם מגיעים גם סיכונים. בדאטה שעליו הם אומנו יש לפעמים תוכן בעייתי; משתמש יצירתי עלול לחלץ מתוכם מידע רגיש; ובכלל – ניתן לעשות איתם שימוש שעומד בניגוד למטרות המוצר או החברה. איך מתגוננים מפני כל זה?
ניב רבין, Principal Software Architect בסייברארק, הגיע לאולפן יחד עם עמיתו לחברה, רן בר-זיק (שאותו אין צורך להציג) ויחד דיברנו על טכניקות הגנתיות בעבודה עם מודלי שפה גדולים. מה עושים Guardrails ואיך עובדים איתם? איך מונעים ממשתמשים להכניס פרטים שלא כדאי שיכניסו, כמו מספרי תעודת זהות? כיצד נעזרים במודל שפה נוסף, לצד המודל הבסיסי, כדי לשמור ולפקח על מה שנכנס ויוצא? ואיך כל זה קשור לקומיקס של xkcd?
האזנה נעימה,
בועז לביא
Podchaser is the ultimate destination for podcast data, search, and discovery. Learn More