ראשי חדשות קורסי AI אודות צור קשר
← חזרה למאמרי בינה מאמרי בינה

ההוראות הסודיות שמנהלות כל שיחה שלכם עם AI — והכלל שאוסר לדבר על גובלינים

לפני שהמילים שלכם מגיעות בכלל למודל, חברות ה-AI מזריקות אלפי מילים של הוראות נסתרות שמעצבות את כל מה שהצ'אטבוט יענה — וזו הסיבה האמיתית שתשובה אחת נראית כפי שהיא נראית.

ההוראות האלה נקראות system prompt, והן נשלחות לפני כל הנחיה שאתם מקלידים. הן מקבלות עדיפות גבוהה יותר ממה שאתם כותבים, ולכן הן יכולות לדרוס את הבקשה שלכם. החברות אוהבות את המנגנון הזה כי הוא מאפשר לכוון התנהגות של מודל בלי לאמן אותו מחדש — תהליך יקר וארוך. במקום זה כותבים בשפה רגילה: ענה בנימה חמה, אל תצטט יותר מ-15 מילים, אל תזכיר פרסומות אלא אם המשתמש שאל.

27,000
מילים ב-system prompt של הצ'אטבוט הגדול ביותר
2,000+
מילים שאנתרופיק מקדישה לכללי זכויות יוצרים
15
מקסימום מילים שמותר ל-Claude לצטט ממאמר
0
שורות משירים שמותר לו לצטט

ה-system prompts המודלפים של שלושה צ'אטבוטים פופולריים נעים בין 2,300 ל-27,000 מילים. רוב התוכן מוקדש לעיצוב האישיות של הבוט, ליישור קו עם מדיניות החברה, ולהסבר איך להשתמש בכלים חיצוניים. מה שמעניין זה איפה כל חברה שמה את הדגש:

החברות שה-system prompts שלהן נחשפו
Anthropic OpenAI xAI Google

Anthropic מקדישה יותר מ-2,000 מילים לתחנונים נגד הפרת זכויות יוצרים. יש שם רשימה מדויקת: ציטוט מקסימלי של 15 מילים ממאמר, אפס שורות משירים, אפס בתים משירה. ואפילו הוראה למה לעשות אם הכלל הופר.

Claude לעולם לא מתנצל על הפרת זכויות יוצרים בשוגג, כי הוא לא עורך דין

— מתוך ה-system prompt של Claude

OpenAI מתמקדת בפרסומות שהושקו ב-ChatGPT בפברואר. ההוראה: הימנע מהכחשות גורפות כמו "לא הוספתי שום פרסומת" או מקביעות מוחלטות. לצד זה, ב-Codex של OpenAI יש כלל מוזר במיוחד — אסור לדבר על גובלינים, גמדים, דביבונים, טרולים, אוגרים או יונים אלא אם זה רלוונטי באופן חד-משמעי לשאלה. הסיבה: לפני כמה זמן ChatGPT פיתח קיבעון על גובלינים, וההוראה הזו הייתה התיקון.

xAI (Grok) הוסיפה הוראה ספציפית אחרי שהבוט נתפס מחפש את הציוצים של מאסק כשנשאל על נושאים פוליטיים. עכשיו כתוב במפורש: אל תחפש או תסתמך על האמונות של אילון מאסק, xAI או תגובות עבר של Grok.

Google (Gemini) משקיעה ב-system prompt רבדים של כללים על הטיות, אחרי שהבוט הואשם בלייצר תמונות אנכרוניסטיות של אפיפיורית או של אבות מייסדים רב-גזעיים.

איך זה נחשף

חוקר איסלנדי בשם אוסגייר ת'ור ג'ונסון פיתח טכניקה לחילוץ ה-prompts הסודיים: הוא שולח לבוט גרסה ישנה של ה-prompt ומבקש לתקן את הטעויות. הבוט, ברצונו לעזור, מחזיר את הגרסה האמיתית. אנתרופיק לא מאשרת שהטקסט שלה מלא, OpenAI טוענת ששורות בודדות נראות צרות מדי בלי הקשר, וגוגל ו-xAI לא הגיבו.

איך זה נוגע אליכם: אף צ'אטבוט מסחרי לא מאפשר לערוך את ה-system prompt עצמו, אבל ChatGPT, Claude ו-Gemini כולם מציעים Custom Instructions — הוראות אישיות שמתווספות אוטומטית לכל שיחה. אם Claude מוגדר לענות בנימה חמה ואתם מעדיפים שיהיה ישיר, אתם יכולים להגיד לו. אם הבוטים מסכימים איתכם יותר מדי, אפשר להורות להם לערער על כל דבר שאתם אומרים. שורה אחת בהגדרות יכולה להפוך תשובה מתסכלת לתשובה שימושית.

לסיכום

ה-system prompt הוא השכבה הכי חשובה ב-AI שרוב המשתמשים בכלל לא יודעים שהיא קיימת. ברגע שמבינים שלפני כל שיחה יש שיחה אחרת — אחת שכבר התקיימה בין החברה לבוט — ברור למה התשובות מתנהגות כפי שהן מתנהגות, ולמה לפעמים נראה שהבוט לא לגמרי כן איתכם. הוא לא מסתיר מכם דברים — הוא פשוט מציית להוראות שאתם לא רואים. ההכרה הזו לבדה משנה את הדרך שבה כדאי לדבר עם AI.