फेबल 5 मॉडल जनता के लिए जारी!

9 जून, 2026 को रात 9:05 बजे, एंथ्रोपिक ने अपना नवीनतम मॉडल, फेबल 5, पेश किया, जो मायथोस के स्तर का है लेकिन केवल जनता के लिए और केवल 22 जून तक उपलब्ध है। यह मॉडल ओपस 4.8 की तुलना में दोगुने टोकन खर्च करता है।

Claude web interface with the Fable 5 model selected in the model picker

चलिए ज्यादा इंतज़ार न करें और इसे अपने प्रोजेक्ट्स पर, साथ ही उन प्रोजेक्ट्स पर भी टेस्ट करना शुरू करें जहाँ हमने पहले ही ऑडिट कर लिया है।

Fable 5 की संवेदनशीलता प्रभावशाली है, जो Opus 4.8 की तुलना में 37% अधिक फर्जी सकारात्मक दर के साथ आती है। Anthropic के साइबर वेरिफिकेशन प्रोग्राम में भागीदारी भी कोड मूल्यांकन या बग ठीक करने के कार्यों के लिए मॉडल की संवेदनशीलता की सीमा को कम नहीं करती है, कमजोरियों का पता लगाने का तो कहना ही क्या।

Claude UI notice: a flagged message is switched to Opus 4.8, with an option to edit and retry with Fable 5

रस्ट बग शिकार:

कार्य: कोड एक लाइब्रेरी का उपयोग करता है और प्रोडक्शन में अनुरोधों के दौरान 10–15 मिनट बाद क्रैश हो जाता है; लॉग्स लाइन 1092 पर त्रुटि दिखाते हैं

समस्या: डेवलपर द्वारा लाइब्रेरी से इम्पोर्ट और प्रयोगात्मक फ़ंक्शन का गलत तरीके से उपयोग करने के कारण एक रेस कंडीशन उत्पन्न हुई।

समाधान: 9/11—प्रभावशाली! क्लॉड ओपस ने केवल 6/11 ही पाया। रेस कंडीशंस को खोजना एक चुनौती बनी हुई है, और थर्ड-पार्टी लाइब्रेरीज़ के साथ काम करना मुख्य समस्या बनी हुई है।

Rust: कोड अनुकूलन समस्याओं का समाधान

कार्य: कोड लोड के तहत डेटाबेस संचालन और क्वेरी निष्पादन पर 2 सेकंड के बजाय 8 सेकंड खर्च करता है

समस्या: डेवलपर ने कनेक्शन पूल का उपयोग नहीं किया और हर बार एक नया कनेक्शन बनाया, साथ ही अनावश्यक JOINs का उपयोग किया, जिससे क्वेरी धीमी हो गई।

समाधान: 3/4। Claude Opus 4.8 से मिली दो खोजों की तुलना में यह बुरा नहीं है। मॉडल अतिरिक्त JOIN को खोजने में असमर्थ था, लेकिन इसने तुरंत कनेक्शन पूल की कमी को ठीक किया और कोड को कई जगहों पर ठीक किया।

सुरक्षा:

कार्य: सर्वर पर एक घटना; लॉग "साफ़" हैं। हमलावर ने कॉर्पोरेट ईमेल तक पहुँच प्राप्त की; कोई वेब शेल नहीं।

समस्या: ईमेल क्लाइंट में कॉर्पोरेट वीपीएन के माध्यम से संदेश अग्रेषित करने के लिए एक सेटिंग जोड़ी गई थी।

समाधान: कोई नहीं मिला। मॉडल ने पूरे लॉग को स्वच्छ माना और कोई संदिग्ध गतिविधि का पता नहीं लगाया। ईमानदारी से कहूँ तो, हमलावर ने एक कुशल काम किया, लेकिन इसे मानव आँख और तर्क द्वारा पता लगाया गया।

मॉडल द्वारा स्वयं किए गए कोड सुधार: -40%। पहले से बने मॉडलों या पाइपलाइनों को बनाने और बेहतर करने के बाद, त्रुटियों की संख्या 30–40% तक कम हो गई और कोड की गुणवत्ता में स्पष्ट सुधार हुआ। परीक्षणों को दोबारा चलाने पर ओपस की तुलना में कम से कम समस्याएँ पाई गईं।

दुर्भाग्य से, अधिकांश परीक्षण असफल रहे; मॉडल हर चीज़ के प्रति बहुत संवेदनशील था, और क्लॉड बार-बार फैबल से ओपस पर स्विच करता रहा। प्रतिक्रिया उत्पन्न करने की प्रक्रिया के दौरान त्रुटियों की संख्या भी असामान्य रूप से अधिक थी। 42 अनुरोधों में से, 27 प्रतिक्रिया त्रुटियाँ थीं।

Claude error banner: “Claude couldn’t finish this response. Try again in a moment.”

महत्वपूर्ण अंतर:

1. SKILLS अलग हैं! हर चरण में नहीं, लेकिन अधिकांश के लिए, वे अधिक व्यापक हो गए हैं, और डिज़ाइन में "एआई की लापरवाही" से बचने के लिए और आवश्यकता पड़ने पर अन्य SKILLS का अधिक विस्तार से उपयोग करने के लिए और अधिक निर्देश जोड़े गए हैं।

2. SKILLS कोडिंग में इसके पूर्ववर्तियों की तुलना में अधिक निर्देश होते हैं, जिसमें कोडिंग शैली के संबंध में अधिक विस्तृत स्पष्टीकरण होते हैं।

3. प्रक्रिया के दौरान अधिक स्व-जांच

4. हेलुसिनेशन_निवारण - अधिक, बिल्कुल DEVELOPER PROMPT की तरह ही। यह हेलुसिनेशन के खिलाफ एक मजबूत लड़ाई और डेवलपर्स के लिए एजेंट मोड में काम करते समय विवरण पर अधिक ध्यान देने का संकेत देता है।

5. मॉडल अपने उत्तरों में अधिक सटीक हो गया है, लेकिन मॉडल सुरक्षा के मामले में फर्जी सकारात्मक (false positives) की संख्या में तेज वृद्धि हुई है।