
החודש האחרון היה מטורף בעולם הסייבר. Anthropic שחררה את Mythos — מודל שלפי הצהרותיה מסוגל לאתר אלפי פרצות קוד שאיש לא ידע על קיומן. הצעד היה כל כך זהיר שהחברה הגבילה את הגישה לארבע חברות בלבד, במסגרת פרויקט בשם Glasswing. הממשל בוושינגטון כבר מדבר על פיקוח חדש על מודלים, וב-OpenAI הזדרזו להכריז על GPT-5.5-Cyber — מודל ייעודי לסייבר שיינתן רק לצוותים מאומתים.
ואז הגיעו חוקרי הסייבר עם בועה.
המודלים שכבר זמינים בשוק חזקים מספיק לאתר את אותן פרצות. זה לא נושא של פריצת דרך טכנולוגית — זה נושא של תזמור.
קלאודיה קלוץ, מנכ"לית חברת הסייבר Vidoc, אמרה בראיון ל-CNBC בפשטות: המודלים שיש לנו עכשיו חזקים מספיק לאתר zero days בקנה מידה גדול. לדבריה, היכולת הזו קיימת כבר "כמה חודשים, אם לא שנה". בחברה לקחו את אותו קוד שעליו רצה Mythos, הריצו עליו מודלים ישנים יותר של Anthropic ו-OpenAI — ומצאו את אותן פרצות.
בחברת Aisle הלכו צעד נוסף. המייסד סטניסלב פורט הסביר בבלוג שלו את העיקרון בדימוי שווה לזכור:
אלף בלשים סבירים שמחפשים בכל מקום ימצאו יותר באגים מבלש גאון אחד שצריך לנחש איפה להסתכל.
במילים אחרות — נחילים של מודלים זולים שעובדים במקביל מנצחים מודל יחיד מתוחכם. ובן האריס, מנכ"ל חברת watchTowr, מתאר את שיחותיו עם בנקים ורגולטורים בשבועות האחרונים כ"היסטריה" של ממש.
הפער האמיתי הוא לא AI מול AI — הוא בין תקיפה לתיקון. אפילו לפני העידן של AI גנרטיבי, האקרים מנצלים פרצה תוך שעות, בעוד שתיקון שלה לוקח ימים או שבועות. חלק מהתיקונים דורשים השבתת מערכות קריטיות. ה-AI הופך את הצד התוקף למהיר פי עשרה — בלי לעשות שום דבר לצד המגן.
ג'יימי דיימון מ-JPMorgan אמר את זה במפורש בחודש שעבר: AI אולי יעזור לחברות להגן על עצמן בעתיד, אבל בינתיים הוא בעיקר חושף אותן. ג'סטין הרינג, לשעבר בכיר ברגולציית הסייבר של ניו יורק, ניסח את זה אפילו יותר טוב:
ניהול פגיעויות הוא משימת סיזיפוס הגדולה של עולם הסייבר.
יש כאן גם מימד גיאופוליטי. ההאקרים בצפון קוריאה, סין ורוסיה, אמרה קלוץ, "יודעים לעשות את זה, עם או בלי Anthropic". המגבלה של Anthropic על Mythos לארבע חברות אמריקאיות אולי קונה זמן, אבל היא גם יוצרת — כפי שמתאר זאת פאבל גורביץ' מ-Tenzai — מעמדות של "יש" ו"אין", שעלולים להאט דווקא את החדשנות בצד המגן.
הסיפור האמיתי כאן הוא לא Mythos. הסיפור הוא שכבר שנה שלמה לחברות יש את היכולת להריץ מודלים זמינים וזולים נגד הקוד שלהן ולסגור פרצות — והן לא עושות את זה. בזמן שכולם נדהמו מההכרזה של Anthropic, האקרים בעולם השלישי מריצים גרסאות גרועות יותר של אותו רעיון על הקוד שלנו. כל מודל חדש שייצא רק יחדד את אותה אמת לא נוחה: הצד התוקף תמיד יהיה מהיר יותר, כל עוד אנחנו מסתכלים על AI כאיום ולא ככלי שצריך לאמץ מיד גם בצד השני של המתרס.