שלושה חבר'ה מתיישבים בדיינר של Denny's בסן חוזה ב-1993 ומחליטים להקים חברה. אין להם הרבה כסף, אין להם מוצר, יש להם רק רעיון אחד: לבנות שבב שיגרום למשחקי וידאו להיראות טוב יותר. אף אחד מהם לא דמיין שאותה חברה תהיה שווה יותר מ-4.5 טריליון דולר, ושכל מודל שפה גדול, כל צ'אטבוט, כל מערכת AI בעולם — ירוצו על החומרה שלהם.

הסיפור של Nvidia הוא אחד הסיפורים המרתקים בעולם הטכנולוגיה, לא כי הם בנו שבב מהיר יותר — אלא כי הם הבינו עשור לפני כולם שהשבב הנכון יכול לשנות מה שניתן לחשב בכלל.

מגיימינג לליבת ה-AI

הציר שסובב הכל קרה ב-2006, כשהשיקו את CUDA — ממשק תכנות שאיפשר לראשונה להשתמש ב-GPU לחישובים כלליים, לא רק לגרפיקה. באותה תקופה זה נשמע כמו תוספת טכנית. בדיעבד, זה היה אחד הצעדים האסטרטגיים הגדולים בהיסטוריה של התעשייה.

1993 נוסדה ב-Denny's בסן חוזה. מטרה: שבבי גרפיקה למשחקים.
1999 ממציאים רשמית את ה-GPU המודרני. גיימינג, הדמיה, גרפיקה — Nvidia הופכת לדומיננטית.
2006 השקת CUDA — GPU לחישוב כללי. הרגע שבו נזרעו זרעי מהפכת ה-AI.
2012 AlexNet מנצח בתחרות ImageNet על GPU של Nvidia. Deep Learning פורץ לעולם.
2020+ GPT, Stable Diffusion, ChatGPT — כולם רצים על Nvidia. החברה הופכת לתשתית של תעשייה שלמה.

כשה-Deep Learning התפוצץ ב-2012, מתברר שה-GPU — שנבנה לצייר פיקסלים מהר — הוא בדיוק הארכיטקטורה שצריך לאמן רשתות עצביות. Nvidia לא תיכננה את זה. הם פשוט בנו את הכלי הנכון לרגע הנכון — ואז הדביקו אליו אקו-סיסטם שלם שקשה מאוד לעזוב.

GTC 2026: מה הכריז הואנג השבוע

ג'נסן הואנג עלה לבמה ב-SAP Center בסן חוזה מול אלפי מפתחים — ולצד ה-Groq 3 LPU, היו עוד כמה הכרזות שמשלימות תמונה גדולה אחת:

Vera Rubin + Feynman

דור ה-GPU הבא לדאטה סנטרים, עם מפת דרכים ברורה ליורשו — מערכת Feynman שתציע 10 פעמים יותר ביצועים לוואט לעומת הדור הקודם.

🧠

Vera CPUs

Nvidia נכנסת רשמית לשוק ה-CPU לשרתים — תחרות ישירה עם Intel ו-AMD — כחלק מחבילת דאטה סנטר מלאה: CPU + GPU + אינטרקונקט.

🚀

Groq 3 LPU (לא Grok של מאסק)

שבב אינפרנס ייעודי שנרכש מחברת Groq — שם דומה, עולם אחר לגמרי מה-Grok של X. ארון של 256 יחידות עם פי 35 טוקנים לוואט. נבנה לרוץ, לא לאמן.

💡

שבבים פוטוניים

כיוון R&D לשבבים שמשתמשים באור להעברת נתונים — פתרון לבעיית צריכת החשמל המטורפת של מרכזי נתונים של AI.

כל ההכרזות האלה מסמנות כיוון אחד ברור: Nvidia לא בונה עוד GPU מהיר יותר — היא בונה את התשתית השלמה שתריץ את ה-AI של העשור הבא. מחברת שבבים למפעל חישוב לאומי.

הרכישות שמספרות את הסיפור האמיתי

אם רוצים להבין לאן Nvidia הולכת, כדאי להסתכל לא על מה שהם בנו — אלא על מה שהם קנו:

Mellanox — רשתות דאטה סנטר ואינפיניבנד. זה הדבק שמחבר אלפי GPUs לסופרקומפיוטר אחד. Run:ai — סטארטאפ ישראלי לאורקסטרציה של GPU. כלומר, Nvidia רוצה לשלוט גם על ניהול המשאבים, לא רק על הברזל. Deci — עוד חברה ישראלית, הפעם לאופטימיזציה של מודלים. Groq — כאמור, צ'יפי אינפרנס. וניסיון כושל לקנות את Arm ב-40 מיליארד דולר — עסקה שנחסמה על ידי רגולטורים, אבל מראה עד כמה הם רצו שליטה גם בשכבת ה-CPU הבסיסית ביותר.

הדפוס ברור: Nvidia רוצה להיות מערכת ההפעלה של ה-AI. לא רק החומרה — אלא הסטאק המלא, מהשבב ועד לספריית התוכנה, ועד לאופן שבו המשאבים מנוהלים.

המשחק הגדול: מאימון לאינפרנס

כדי להבין מה הכריז הואנג השבוע, צריך להבין הבחנה אחת בסיסית שרוב האנשים מחמיצים: ההבדל בין אימון מודל לבין הרצת מודל.

🎓 מה זה אינפרנס בכלל?

כשחברת AI בונה מודל שפה כמו ChatGPT, הם עושים שני דברים שונים לגמרי. אימון (Training) — זה השלב שבו המודל "לומד" מכמויות עצומות של טקסט. קורה פעם אחת, לוקח שבועות, עולה עשרות מיליוני דולרים. אינפרנס (Inference) — זה מה שקורה כל פעם שאתה כותב הודעה ל-ChatGPT וקיבלת תשובה. כל פרומפט, כל שאלה, כל בקשה — זה אינפרנס. זה קורה מיליארדי פעמים ביום, בכל שנייה, בכל העולם. עד היום, ה-GPU — שנבנה בעיקר לאימון — שימש גם לאינפרנס. זה כמו לנסוע לסופר במשאית הובלה. עובד, אבל לא אופטימלי.

ג'נסן הואנג השבוע הכריז: גמרנו עם הפשרות. Nvidia מציגה שבב שנבנה מהיסוד רק לאינפרנס — ה-Groq 3 LPU (לא קשור ל-Grok של אילון מאסק — שם דומה, חברת שבבים אחרת לגמרי). ה-LPU מגיע בארון של 256 יחידות ומספק פי 35 יותר טוקנים לוואט לעומת GPU רגיל. במילים פשוטות: לכל קילוואט חשמל, תקבל 35 פעמים יותר תשובות מ-AI.

למה זה חשוב? כי צריכת החשמל היא צוואר הבקבוק של עידן ה-AI. מרכזי נתונים גדולים כבר צורכים יותר חשמל מערים שלמות. אם אפשר לקבל 35 פעמים יותר אינפרנס מאותה כמות חשמל — זה לא שיפור, זה שינוי כלכלי מהותי של כל ה-business model של AI בענן.

לסיכום

Nvidia התחילה כחברה שרצתה שמשחקים ייראו יפה יותר. היא הפכה לתשתית שעליה רצה כל מהפכת ה-AI של עשרות השנים האחרונות. ב-GTC 2026 הם הראו שהם לא מסתפקים בזה — הם רוצים לבנות את המפעלים, את השבבים, את הרשתות, ואת כלי הניהול שיריצו את ה-AI של העשור הבא. הסיפור של Nvidia הוא תזכורת שהחברות שמשנות עולמות לא תמיד עושות זאת עם פרודוקט מהפכני — לפעמים מספיק להיות בעמדה הנכונה כשהגל מגיע, ולהיות חכמים מספיק כדי לרכוב עליו.