प्रमाण

प्रकाशित बेंचमार्क। $10। हर कठिन सवाल का जवाब।

8 min read

यह कोई पिच नहीं है। यह एक प्रकाशित परिणाम है।

नौ अरब पैरामीटर का एक खुला मॉडल — Qwen 3.5, विशेषज्ञ-गुणवत्ता ड्रग इंटरैक्शन डेटा पर QDoRA से फ़ाइन-ट्यून किया गया और FDA-अनुमोदित दवा लेबल पर रिट्रीवल से संवर्धित — फार्माकोलॉजिकल मैकेनिज़्म पहचान पर GPT-5.4, Claude Opus 4.6, और Gemini 3.1 Pro से बेहतर प्रदर्शन करता है।

यह 92% ड्रग इंटरैक्शन मैकेनिज़्म की पहचान करता है। GPT-5.4 69% की पहचान करता है। कुल लागत: दस डॉलर।


दावा।

हम दावा कर रहे हैं: एक छोटा, खुला, विशेषज्ञ-प्रशिक्षित मॉडल, आधिकारिक FDA डेटा पर रिट्रीवल के साथ, फ्रंटियर मॉडल्स से अधिक सटीक रूप से ड्रग इंटरैक्शन मैकेनिज़्म की पहचान करता है — अपने साक्ष्य का हवाला देते हुए। ऐसा AI नहीं जो फार्मासिस्ट को विस्थापित करे। ऐसा AI जिस पर फार्मासिस्ट भरोसा कर सके।

हम दावा नहीं कर रहे: एक 9B मॉडल सामान्य ज्ञान, रचनात्मक लेखन, या अपने प्रशिक्षित डोमेन के बाहर किसी कार्य पर फ्रंटियर मॉडल्स को हराता है।

दावा संकीर्ण और विशिष्ट है। इसीलिए यह विश्वसनीय है — और सामान्यीकरण योग्य, क्योंकि तंत्र (विशेषज्ञ प्रशिक्षण + संरचित रिट्रीवल) किसी भी ज्ञान-गहन पेशेवर डोमेन पर लागू होता है।


परिणाम।

मॉडलMechanism RecallSeverity AccuracyManagementCitationsकॉन्फ़िगरेशन
Qwen 3.5 9B + QDoRA + RAG0.9170.400100%90%फ़ाइन-ट्यून, FDA लेबल पर रिट्रीवल
GPT-5.40.6920.900100%0%डिफ़ॉल्ट कॉन्फ़िगरेशन
Claude Opus 4.60.8250.700100%50%डिफ़ॉल्ट कॉन्फ़िगरेशन
Gemini 3.1 Pro0.8920.700100%100%डिफ़ॉल्ट कॉन्फ़िगरेशन

DrugBank से 10 होल्ड-आउट ड्रग इंटरैक्शन परिदृश्य, ग्राउंड ट्रुथ के विरुद्ध मूल्यांकित। फ्रंटियर मॉडल OpenRouter API के माध्यम से परीक्षित। हमारा मॉडल MacBook Air पर स्थानीय रूप से चलता है (Q4 क्वांटाइज़्ड, 5.2 GB)।

हमारा मॉडल सर्वोच्च mechanism recall प्राप्त करता है और एकमात्र ऐसा है जो लगातार आधिकारिक साक्ष्य (90%) का हवाला देता है और प्रबंधन सिफ़ारिशें (100%) प्रदान करता है। GPT-5.4 severity classification में जीतता है लेकिन कभी स्रोत का हवाला नहीं देता — नैदानिक अभ्यास में, बिना स्रोत का उत्तर कार्रवाई योग्य नहीं है।


लागत।

चरणलागत
प्रशिक्षण डेटा (4,573 नैदानिक इंटरैक्शन मूल्यांकन)~$8
फ़ाइन-ट्यूनिंग (QDoRA, 3 epochs, A100, 54 मिनट)~$1.30
RAG कॉर्पस (757 FDA दवा लेबल, 5,622 अनुच्छेद)निःशुल्क
बेंचमार्किंग (OpenRouter के माध्यम से फ्रंटियर मॉडल तुलना)~$1
कुल~$10

फ़ाइन-ट्यूनिंग लेयर — जहाँ पेशेवर विशेषज्ञता रहती है — की लागत दस डॉलर है। इसकी तुलना फ्रंटियर मॉडल प्रशिक्षण लागत से करें: प्रति रन करोड़ों डॉलर।


इसे दोहराएँ।

सारा कोड हमारी ओपन-सोर्स रिपॉज़िटरी में scripts/ai-poc/ पर है:

  1. fetch_drugbank.py — DrugBank से ड्रग इंटरैक्शन जोड़ियाँ डाउनलोड करें
  2. fetch_openfda_interactions.py — FDA दवा लेबल टेक्स्ट फ़ेच करें (निःशुल्क, कोई auth नहीं)
  3. build_retrieval_index.py — FDA नैदानिक टेक्स्ट पर FAISS वेक्टर इंडेक्स बनाएँ
  4. generate_raft_pairs.py — विशेषज्ञ-संरचित प्रशिक्षण जोड़ियाँ बनाएँ (~$8)
  5. export_training.py — train/validation/test विभाजन के साथ JSONL में निर्यात करें
  6. train.sh — क्लाउड GPU पर QDoRA फ़ाइन-ट्यून (~$1.30)
  7. merge_weights.py — तेज़ इन्फ़ेरेंस के लिए एडॉप्टर वज़न मर्ज करें
  8. benchmark_local.py — फ्रंटियर मॉडल्स के विरुद्ध पूर्ण तुलना

कुल वॉल-क्लॉक समय: लगभग एक दिन। कुल लागत: लगभग दस डॉलर।

अगर आप हमें ग़लत साबित कर सकते हैं, तो करें। हम कोड इसलिए प्रकाशित करते हैं क्योंकि हम चाहते हैं कि आप कोशिश करें।


कठिन सवाल। ईमानदार जवाब।

यदि आप यहाँ तक पढ़ रहे हैं, तो आप वैसे व्यक्ति हैं जो आसानी से किसी चीज़ से नहीं जुड़ते। अच्छा। हम उत्साह नहीं ढूँढ रहे। हम विवेक ढूँढ रहे हैं।


"विशेषज्ञ योगदान क्यों करेंगे?"

राजस्व। उपभोक्ता राजस्व का 95% विशेषज्ञों को जाता है। गिल्ड सदस्यों को $20 की बजाय $5 में पूर्ण AI एक्सेस मिलता है।

AI जो उनके लिए काम करता है। आपके क्षेत्र में सत्यापित विशेषज्ञों द्वारा प्रशिक्षित, उन डेटाबेस पर रिट्रीवल के साथ जो आप वास्तव में उपयोग करते हैं।

दस मिनट, करियर बदलाव नहीं। न्यूनतम योगदान: पाँच सेकंड का हाँ/नहीं निर्णय।


"$5/महीना क्यों? निःशुल्क क्यों नहीं?"

हम $5 इसलिए लेते हैं ताकि हमें कभी वेंचर कैपिटल लेने की ज़रूरत न पड़े। कोई निवेशक 95% योगदानकर्ताओं को जाने देने की अनुमति नहीं देगा। कोई निवेशक ऐसे संविधान को स्वीकार नहीं करेगा जो श्रम-प्रतिस्थापन डिज़ाइन पर प्रतिबंध लगाता है। $5 स्वतंत्रता की कीमत है।

योगदान निःशुल्क है — कोई भी पंजीकरण करके quick review कर सकता है। गिल्ड सदस्यता ($5/महीना) पूर्ण रिव्यू टूल्स, AI एक्सेस, और राजस्व हिस्सा अनलॉक करती है।


"विशेषज्ञों को 95% — यह टिकाऊ कैसे है?"

दो राजस्व धाराएँ। गिल्ड शुल्क ($5/महीना प्रति विशेषज्ञ) कोर टीम को फंड करता है। कंपनी को उपभोक्ता राजस्व का 5% भी मिलता है। संविधान इसकी गारंटी देता है — कंपनी गिल्ड सदस्यों के विशाल बहुमत मत के बिना अपना हिस्सा 5% से अधिक नहीं बढ़ा सकती। इंफ्रास्ट्रक्चर लागत मासिक प्रकाशित होती है।


"यह ChatGPT से क्या कर सकता है जो वह नहीं कर सकता?"

पाँच चीज़ें जो कोई फ्रंटियर मॉडल गारंटी नहीं दे सकता:

  1. स्रोत एट्रिब्यूशन। हर दावा उस नामांकित विशेषज्ञ तक ट्रेस होता है जिसने इसे सत्यापित किया।
  2. नियतात्मक गणना। टैक्स स्लैब, दवा खुराक, बिल्डिंग कोड — गणना किए गए, predict नहीं।
  3. अस्थायी वैधता। कानून बदलने पर यूनिट्स समाप्त हो जाती हैं। LLMs आत्मविश्वास से पिछले साल के नियम उद्धृत करते हैं।
  4. अधिकार क्षेत्र विशिष्टता। चेक टैक्स कानून जर्मन टैक्स कानून नहीं है। एक मॉडल दोनों की सेवा नहीं कर सकता।
  5. सहमति और मुआवज़ा। योगदान देने वाला हर विशेषज्ञ नामांकित, सहमत, और भुगतान पाता है।

"अगर फ्रंटियर मॉडल बेहतर हो जाएँ तो?"

अंतर आर्किटेक्चरल है, प्रदर्शन लीड नहीं। फ्रंटियर मॉडल predict करते हैं कि उत्तर कैसा दिखेगा। हम संकलित करते हैं कि पेशेवर वास्तव में कैसे तर्क करते हैं — सत्यापित यूनिट्स में जो नियतात्मक रूप से execute होती हैं। फ्रंटियर मॉडल सही टैक्स गणना का अनुमान लगाने में बेहतर हो सकता है। हमारा सिस्टम टैक्स गणना चलाता है। यह एक संरचनात्मक गुण है, घटने वाली लीड नहीं।

बेस मॉडल बेहतर होता है — हम इसे स्वैप कर लेते हैं। विशेषज्ञ तर्कशक्ति खाई है, मॉडल वज़न नहीं।


"कौन से पेशे कवर नहीं करते?"

जानबूझकर: सॉफ्टवेयर इंजीनियरिंग, डेटा साइंस, डिज़ाइन, मैनेजमेंट कंसल्टिंग, रचनात्मक कार्य। इनमें LLMs पहले से अच्छा काम करते हैं। हम उन 124 पेशों के लिए बनाते हैं जहाँ AI सबसे कमज़ोर है — नियम-गहन, अधिकार क्षेत्र-विशिष्ट, उच्च-जोखिम।


"गेमिंग कैसे रोकते हैं?"

तीन स्तर: स्वचालित विसंगति पहचान (डुप्लिकेट, वॉल्यूम विसंगतियाँ, साहित्यिक चोरी), सहकर्मी समीक्षा (हर योगदान 2+ सत्यापित पेशेवरों द्वारा समीक्षित), और क्रेडेंशियल सत्यापन (लाइसेंस, प्रमाणन, या डिग्री — डोमेन शासन समिति द्वारा समीक्षित)। गुणवत्ता के बिना वॉल्यूम कुछ नहीं कमाता।


"यह क्रिप्टो जैसा लगता है।"

कोई टोकन नहीं। कोई ब्लॉकचेन नहीं। कोई सट्टेबाज़ी नहीं। अंक स्थायी, अहस्तांतरणीय, गैर-व्यापार योग्य हैं। ये सत्यापित पेशेवर योगदान को दर्शाते हैं, बेचने की स्थिति नहीं। विशेषज्ञों के लिए $5/महीना। उपभोक्ताओं के लिए $20/महीना। पारदर्शी लागत। संवैधानिक सुरक्षा।


"एक व्यक्ति यह नहीं बना सकता।"

एक व्यक्ति ने इसे शुरू किया। संविधान सुनिश्चित करता है कि कोई एक व्यक्ति इसे नियंत्रित न करे। विशेषज्ञ समुदाय अपने डोमेन शासित करते हैं। संवैधानिक बाधाएँ कंपनी कोई भी चलाए, अधिग्रहण रोकती हैं।


अभी भी आश्वस्त नहीं? संविधान पढ़ें — यह जानने का सबसे छोटा रास्ता है कि हम गंभीर हैं या नहीं।

निःशुल्क योगदान करें · गिल्ड से जुड़ें — $5/महीना