عندما نتحدث عن تكلفة البنية التحتية للذكاء الاصطناعي، يكون التركيز عادةً على Nvidia ووحدات معالجة الرسومات – لكن الذاكرة أصبحت جزءًا متزايد الأهمية من الصورة. بينما يستعد القائمون على التوسع الفائق لبناء مراكز بيانات جديدة بقيمة مليارات الدولارات، قفز سعر رقائق DRAM بحوالي 7 أضعاف في العام الماضي.
وفي الوقت نفسه، هناك انضباط متزايد في تنسيق كل تلك الذاكرة للتأكد من وصول البيانات الصحيحة إلى العميل المناسب في الوقت المناسب. وستكون الشركات التي تتقن ذلك قادرة على إجراء نفس الاستعلامات باستخدام عدد أقل من الرموز، وهو ما يمكن أن يشكل الفرق بين الانسحاب والبقاء في العمل.
ألقى محلل أشباه الموصلات، دوج أولولين، نظرة مثيرة للاهتمام على أهمية رقائق الذاكرة في Substack الخاص به، حيث تحدث مع فال بيركوفيتشي، كبير مسؤولي الذكاء الاصطناعي في Weka. كلاهما متخصصان في أشباه الموصلات، لذا فإن التركيز ينصب على الرقائق أكثر من البنية الأوسع؛ إن الآثار المترتبة على برامج الذكاء الاصطناعي مهمة جدًا أيضًا.
لقد أذهلني بشكل خاص هذا المقطع، الذي ينظر فيه بيركوفيتشي إلى التعقيد المتزايد للتوثيق الفوري للتخزين المؤقت في Anthropic:
الحقيقة هي أننا إذا انتقلنا إلى صفحة تسعير التخزين المؤقت الفوري الخاصة بـ Anthropic. لقد بدأت كصفحة بسيطة جدًا قبل ستة أو سبعة أشهر، خاصة مع إطلاق كلود كود – فقط “استخدم التخزين المؤقت، فهو أرخص”. إنها الآن موسوعة من النصائح حول عدد ذاكرة التخزين المؤقت التي يتم كتابتها للشراء المسبق. لديك مستويات مدتها 5 دقائق، وهي شائعة جدًا في جميع أنحاء الصناعة، أو مستويات مدتها ساعة واحدة – ولا يوجد شيء أعلى. هذا هو القول المهم حقا. ثم بالطبع لديك جميع أنواع فرص المراجحة حول تسعير قراءات ذاكرة التخزين المؤقت بناءً على عدد عمليات الكتابة في ذاكرة التخزين المؤقت التي اشتريتها مسبقًا.
السؤال هنا هو إلى متى يحتفظ كلود بمطالبتك في الذاكرة المؤقتة: يمكنك الدفع مقابل نافذة مدتها 5 دقائق، أو دفع المزيد مقابل نافذة مدتها ساعة. من الأرخص بكثير الاعتماد على البيانات التي لا تزال في ذاكرة التخزين المؤقت، لذلك إذا قمت بإدارتها بشكل صحيح، يمكنك حفظ الكثير منها. على الرغم من ذلك، هناك مشكلة: كل جزء جديد من البيانات تضيفه إلى الاستعلام قد يؤدي إلى إخراج شيء آخر من نافذة ذاكرة التخزين المؤقت.
هذه أشياء معقدة، لكن النتيجة بسيطة بما فيه الكفاية: إدارة الذاكرة في نماذج الذكاء الاصطناعي ستكون جزءًا كبيرًا من المضي قدمًا في الذكاء الاصطناعي. الشركات التي تفعل ذلك بشكل جيد سوف ترتفع إلى القمة.
وهناك الكثير من التقدم الذي يتعين إحرازه في هذا المجال الجديد. في شهر أكتوبر الماضي، قمت بتغطية شركة ناشئة تدعى Tensormesh كانت تعمل على طبقة واحدة في المكدس تُعرف باسم تحسين ذاكرة التخزين المؤقت.
حدث تك كرانش
بوسطن، MA
|
23 يونيو 2026
الفرص موجودة في أجزاء أخرى من المكدس. على سبيل المثال، في أسفل المكدس، هناك سؤال حول كيفية استخدام مراكز البيانات للأنواع المختلفة من الذاكرة المتوفرة لديها. (تتضمن المقابلة مناقشة لطيفة حول متى يتم استخدام شرائح DRAM بدلاً من HBM، على الرغم من أنها عميقة جدًا في أعشاب الأجهزة.) وفي أعلى المجموعة، يكتشف المستخدمون النهائيون كيفية تنظيم مجموعات نماذجهم للاستفادة من ذاكرة التخزين المؤقت المشتركة.
مع تحسن الشركات في تنسيق الذاكرة، فإنها ستستخدم عددًا أقل من الرموز المميزة وسيصبح الاستدلال أرخص. وفي الوقت نفسه، أصبحت النماذج أكثر كفاءة في معالجة كل رمز، مما أدى إلى انخفاض التكلفة بشكل أكبر. مع انخفاض تكاليف الخادم، فإن الكثير من التطبيقات التي لا تبدو قابلة للتطبيق الآن ستبدأ في تحقيق الربحية.

