यह कोई पिच नहीं है। यह एक प्रकाशित परिणाम है।
नौ अरब पैरामीटर का एक खुला मॉडल — Qwen 3.5, विशेषज्ञ-गुणवत्ता ड्रग इंटरैक्शन डेटा पर QDoRA से फ़ाइन-ट्यून किया गया और FDA-अनुमोदित दवा लेबल पर रिट्रीवल से संवर्धित — फार्माकोलॉजिकल मैकेनिज़्म पहचान पर GPT-5.4, Claude Opus 4.6, और Gemini 3.1 Pro से बेहतर प्रदर्शन करता है।
यह 92% ड्रग इंटरैक्शन मैकेनिज़्म की पहचान करता है। GPT-5.4 69% की पहचान करता है। कुल लागत: दस डॉलर।
दावा।
हम दावा कर रहे हैं: एक छोटा, खुला, विशेषज्ञ-प्रशिक्षित मॉडल, आधिकारिक FDA डेटा पर रिट्रीवल के साथ, फ्रंटियर मॉडल्स से अधिक सटीक रूप से ड्रग इंटरैक्शन मैकेनिज़्म की पहचान करता है — अपने साक्ष्य का हवाला देते हुए। ऐसा AI नहीं जो फार्मासिस्ट को विस्थापित करे। ऐसा AI जिस पर फार्मासिस्ट भरोसा कर सके।
हम दावा नहीं कर रहे: एक 9B मॉडल सामान्य ज्ञान, रचनात्मक लेखन, या अपने प्रशिक्षित डोमेन के बाहर किसी कार्य पर फ्रंटियर मॉडल्स को हराता है।
दावा संकीर्ण और विशिष्ट है। इसीलिए यह विश्वसनीय है — और सामान्यीकरण योग्य, क्योंकि तंत्र (विशेषज्ञ प्रशिक्षण + संरचित रिट्रीवल) किसी भी ज्ञान-गहन पेशेवर डोमेन पर लागू होता है।
परिणाम।
| मॉडल | Mechanism Recall | Severity Accuracy | Management | Citations | कॉन्फ़िगरेशन |
|---|---|---|---|---|---|
| Qwen 3.5 9B + QDoRA + RAG | 0.917 | 0.400 | 100% | 90% | फ़ाइन-ट्यून, FDA लेबल पर रिट्रीवल |
| GPT-5.4 | 0.692 | 0.900 | 100% | 0% | डिफ़ॉल्ट कॉन्फ़िगरेशन |
| Claude Opus 4.6 | 0.825 | 0.700 | 100% | 50% | डिफ़ॉल्ट कॉन्फ़िगरेशन |
| Gemini 3.1 Pro | 0.892 | 0.700 | 100% | 100% | डिफ़ॉल्ट कॉन्फ़िगरेशन |
DrugBank से 10 होल्ड-आउट ड्रग इंटरैक्शन परिदृश्य, ग्राउंड ट्रुथ के विरुद्ध मूल्यांकित। फ्रंटियर मॉडल OpenRouter API के माध्यम से परीक्षित। हमारा मॉडल MacBook Air पर स्थानीय रूप से चलता है (Q4 क्वांटाइज़्ड, 5.2 GB)।
हमारा मॉडल सर्वोच्च mechanism recall प्राप्त करता है और एकमात्र ऐसा है जो लगातार आधिकारिक साक्ष्य (90%) का हवाला देता है और प्रबंधन सिफ़ारिशें (100%) प्रदान करता है। GPT-5.4 severity classification में जीतता है लेकिन कभी स्रोत का हवाला नहीं देता — नैदानिक अभ्यास में, बिना स्रोत का उत्तर कार्रवाई योग्य नहीं है।
लागत।
| चरण | लागत |
|---|---|
| प्रशिक्षण डेटा (4,573 नैदानिक इंटरैक्शन मूल्यांकन) | ~$8 |
| फ़ाइन-ट्यूनिंग (QDoRA, 3 epochs, A100, 54 मिनट) | ~$1.30 |
| RAG कॉर्पस (757 FDA दवा लेबल, 5,622 अनुच्छेद) | निःशुल्क |
| बेंचमार्किंग (OpenRouter के माध्यम से फ्रंटियर मॉडल तुलना) | ~$1 |
| कुल | ~$10 |
फ़ाइन-ट्यूनिंग लेयर — जहाँ पेशेवर विशेषज्ञता रहती है — की लागत दस डॉलर है। इसकी तुलना फ्रंटियर मॉडल प्रशिक्षण लागत से करें: प्रति रन करोड़ों डॉलर।
इसे दोहराएँ।
सारा कोड हमारी ओपन-सोर्स रिपॉज़िटरी में scripts/ai-poc/ पर है:
fetch_drugbank.py— DrugBank से ड्रग इंटरैक्शन जोड़ियाँ डाउनलोड करेंfetch_openfda_interactions.py— FDA दवा लेबल टेक्स्ट फ़ेच करें (निःशुल्क, कोई auth नहीं)build_retrieval_index.py— FDA नैदानिक टेक्स्ट पर FAISS वेक्टर इंडेक्स बनाएँgenerate_raft_pairs.py— विशेषज्ञ-संरचित प्रशिक्षण जोड़ियाँ बनाएँ (~$8)export_training.py— train/validation/test विभाजन के साथ JSONL में निर्यात करेंtrain.sh— क्लाउड GPU पर QDoRA फ़ाइन-ट्यून (~$1.30)merge_weights.py— तेज़ इन्फ़ेरेंस के लिए एडॉप्टर वज़न मर्ज करेंbenchmark_local.py— फ्रंटियर मॉडल्स के विरुद्ध पूर्ण तुलना
कुल वॉल-क्लॉक समय: लगभग एक दिन। कुल लागत: लगभग दस डॉलर।
अगर आप हमें ग़लत साबित कर सकते हैं, तो करें। हम कोड इसलिए प्रकाशित करते हैं क्योंकि हम चाहते हैं कि आप कोशिश करें।
कठिन सवाल। ईमानदार जवाब।
यदि आप यहाँ तक पढ़ रहे हैं, तो आप वैसे व्यक्ति हैं जो आसानी से किसी चीज़ से नहीं जुड़ते। अच्छा। हम उत्साह नहीं ढूँढ रहे। हम विवेक ढूँढ रहे हैं।
"विशेषज्ञ योगदान क्यों करेंगे?"
राजस्व। उपभोक्ता राजस्व का 95% विशेषज्ञों को जाता है। गिल्ड सदस्यों को $20 की बजाय $5 में पूर्ण AI एक्सेस मिलता है।
AI जो उनके लिए काम करता है। आपके क्षेत्र में सत्यापित विशेषज्ञों द्वारा प्रशिक्षित, उन डेटाबेस पर रिट्रीवल के साथ जो आप वास्तव में उपयोग करते हैं।
दस मिनट, करियर बदलाव नहीं। न्यूनतम योगदान: पाँच सेकंड का हाँ/नहीं निर्णय।
"$5/महीना क्यों? निःशुल्क क्यों नहीं?"
हम $5 इसलिए लेते हैं ताकि हमें कभी वेंचर कैपिटल लेने की ज़रूरत न पड़े। कोई निवेशक 95% योगदानकर्ताओं को जाने देने की अनुमति नहीं देगा। कोई निवेशक ऐसे संविधान को स्वीकार नहीं करेगा जो श्रम-प्रतिस्थापन डिज़ाइन पर प्रतिबंध लगाता है। $5 स्वतंत्रता की कीमत है।
योगदान निःशुल्क है — कोई भी पंजीकरण करके quick review कर सकता है। गिल्ड सदस्यता ($5/महीना) पूर्ण रिव्यू टूल्स, AI एक्सेस, और राजस्व हिस्सा अनलॉक करती है।
"विशेषज्ञों को 95% — यह टिकाऊ कैसे है?"
दो राजस्व धाराएँ। गिल्ड शुल्क ($5/महीना प्रति विशेषज्ञ) कोर टीम को फंड करता है। कंपनी को उपभोक्ता राजस्व का 5% भी मिलता है। संविधान इसकी गारंटी देता है — कंपनी गिल्ड सदस्यों के विशाल बहुमत मत के बिना अपना हिस्सा 5% से अधिक नहीं बढ़ा सकती। इंफ्रास्ट्रक्चर लागत मासिक प्रकाशित होती है।
"यह ChatGPT से क्या कर सकता है जो वह नहीं कर सकता?"
पाँच चीज़ें जो कोई फ्रंटियर मॉडल गारंटी नहीं दे सकता:
- स्रोत एट्रिब्यूशन। हर दावा उस नामांकित विशेषज्ञ तक ट्रेस होता है जिसने इसे सत्यापित किया।
- नियतात्मक गणना। टैक्स स्लैब, दवा खुराक, बिल्डिंग कोड — गणना किए गए, predict नहीं।
- अस्थायी वैधता। कानून बदलने पर यूनिट्स समाप्त हो जाती हैं। LLMs आत्मविश्वास से पिछले साल के नियम उद्धृत करते हैं।
- अधिकार क्षेत्र विशिष्टता। चेक टैक्स कानून जर्मन टैक्स कानून नहीं है। एक मॉडल दोनों की सेवा नहीं कर सकता।
- सहमति और मुआवज़ा। योगदान देने वाला हर विशेषज्ञ नामांकित, सहमत, और भुगतान पाता है।
"अगर फ्रंटियर मॉडल बेहतर हो जाएँ तो?"
अंतर आर्किटेक्चरल है, प्रदर्शन लीड नहीं। फ्रंटियर मॉडल predict करते हैं कि उत्तर कैसा दिखेगा। हम संकलित करते हैं कि पेशेवर वास्तव में कैसे तर्क करते हैं — सत्यापित यूनिट्स में जो नियतात्मक रूप से execute होती हैं। फ्रंटियर मॉडल सही टैक्स गणना का अनुमान लगाने में बेहतर हो सकता है। हमारा सिस्टम टैक्स गणना चलाता है। यह एक संरचनात्मक गुण है, घटने वाली लीड नहीं।
बेस मॉडल बेहतर होता है — हम इसे स्वैप कर लेते हैं। विशेषज्ञ तर्कशक्ति खाई है, मॉडल वज़न नहीं।
"कौन से पेशे कवर नहीं करते?"
जानबूझकर: सॉफ्टवेयर इंजीनियरिंग, डेटा साइंस, डिज़ाइन, मैनेजमेंट कंसल्टिंग, रचनात्मक कार्य। इनमें LLMs पहले से अच्छा काम करते हैं। हम उन 124 पेशों के लिए बनाते हैं जहाँ AI सबसे कमज़ोर है — नियम-गहन, अधिकार क्षेत्र-विशिष्ट, उच्च-जोखिम।
"गेमिंग कैसे रोकते हैं?"
तीन स्तर: स्वचालित विसंगति पहचान (डुप्लिकेट, वॉल्यूम विसंगतियाँ, साहित्यिक चोरी), सहकर्मी समीक्षा (हर योगदान 2+ सत्यापित पेशेवरों द्वारा समीक्षित), और क्रेडेंशियल सत्यापन (लाइसेंस, प्रमाणन, या डिग्री — डोमेन शासन समिति द्वारा समीक्षित)। गुणवत्ता के बिना वॉल्यूम कुछ नहीं कमाता।
"यह क्रिप्टो जैसा लगता है।"
कोई टोकन नहीं। कोई ब्लॉकचेन नहीं। कोई सट्टेबाज़ी नहीं। अंक स्थायी, अहस्तांतरणीय, गैर-व्यापार योग्य हैं। ये सत्यापित पेशेवर योगदान को दर्शाते हैं, बेचने की स्थिति नहीं। विशेषज्ञों के लिए $5/महीना। उपभोक्ताओं के लिए $20/महीना। पारदर्शी लागत। संवैधानिक सुरक्षा।
"एक व्यक्ति यह नहीं बना सकता।"
एक व्यक्ति ने इसे शुरू किया। संविधान सुनिश्चित करता है कि कोई एक व्यक्ति इसे नियंत्रित न करे। विशेषज्ञ समुदाय अपने डोमेन शासित करते हैं। संवैधानिक बाधाएँ कंपनी कोई भी चलाए, अधिग्रहण रोकती हैं।
अभी भी आश्वस्त नहीं? संविधान पढ़ें — यह जानने का सबसे छोटा रास्ता है कि हम गंभीर हैं या नहीं।