Důkaz

Publikovaný benchmark. $10. Každá těžká otázka zodpovězená.

8 min read

Toto není pitch. Je to publikovaný výsledek.

Otevřený model s devíti miliardami parametrů — Qwen 3.5, doladění s QDoRA na expertních datech o lékových interakcích a rozšířený o retrieval nad FDA schválenými lékovými příbalovými informacemi — překonává GPT-5.4, Claude Opus 4.6 a Gemini 3.1 Pro v identifikaci farmakologických mechanismů.

Identifikuje 92 % mechanismů lékových interakcí. GPT-5.4 identifikuje 69 %. Celkový náklad: deset dolarů.


Tvrzení.

Tvrdíme: Malý, otevřený, expertně trénovaný model s retrievalem nad autoritativními daty FDA identifikuje mechanismy lékových interakcí přesněji než velké modely — a cituje své důkazy. Ne AI, která nahrazuje farmaceuta. AI, které farmaceut může důvěřovat.

Netvrdíme: 9B model překonává velké modely na obecných znalostech, kreativním psaní nebo jakémkoli úkolu mimo svou trénovanou doménu.

Tvrzení je úzké a konkrétní. Právě to ho činí věrohodným — a zobecnitelným, protože mechanismus (expertní trénink + strukturovaný retrieval) se vztahuje na jakoukoli znalostně intenzivní profesní doménu.


Výsledky.

ModelMechanism RecallSeverity AccuracyManagementCitationsKonfigurace
Qwen 3.5 9B + QDoRA + RAG0,9170,400100 %90 %Fine-tuned, retrieval nad FDA příbalovými informacemi
GPT-5.40,6920,900100 %0 %Výchozí konfigurace
Claude Opus 4.60,8250,700100 %50 %Výchozí konfigurace
Gemini 3.1 Pro0,8920,700100 %100 %Výchozí konfigurace

10 held-out scénářů lékových interakcí z DrugBank, hodnoceno vůči ground truth. Velké modely testovány přes OpenRouter API. Náš model běží lokálně na MacBook Air (Q4 kvantizace, 5,2 GB).

Náš model dosahuje nejvyššího mechanism recall a je jediný, který konzistentně cituje autoritativní důkazy (90 %) A poskytuje doporučení k managementu (100 %). GPT-5.4 vítězí v klasifikaci závažnosti, ale nikdy necituje zdroje — v klinické praxi je odpověď bez zdroje nepoužitelná.


Co to stálo.

FázeNáklad
Tréninková data (4 573 klinických hodnocení interakcí)~$8
Fine-tuning (QDoRA, 3 epochy, A100, 54 minut)~$1,30
RAG korpus (757 příbalových informací FDA, 5 622 pasáží)zdarma
Benchmarking (srovnání s velkými modely přes OpenRouter)~$1
Celkem~$10

Vrstva fine-tuningu — kde žije profesní expertíza — stojí deset dolarů. Srovnejte to s náklady na trénink velkých modelů: stovky milionů za jedno spuštění.


Reprodukujte to.

Veškerý kód je v scripts/ai-poc/ v našem open-source repozitáři:

  1. fetch_drugbank.py — stažení párů lékových interakcí z DrugBank
  2. fetch_openfda_interactions.py — stažení textu příbalových informací FDA (zdarma, bez autentizace)
  3. build_retrieval_index.py — sestavení FAISS vektorového indexu nad klinickými texty FDA
  4. generate_raft_pairs.py — generování expertně strukturovaných tréninkových párů (~$8)
  5. export_training.py — export jako JSONL se split na train/validation/test
  6. train.sh — QDoRA fine-tune na cloud GPU (~$1,30)
  7. merge_weights.py — sloučení vah adaptérů pro rychlou inferenci
  8. benchmark_local.py — kompletní srovnání s velkými modely

Celkový čas: přibližně jeden den. Celkový náklad: přibližně deset dolarů.

Pokud nám můžete dokázat, že se mýlíme, udělejte to. Kód zveřejňujeme, protože chceme, abyste to zkusili.


Těžké otázky. Poctivé odpovědi.

Pokud čtete až sem, jste typ člověka, který se nepřidává ke věcem snadno. Dobře. Nehledáme nadšení. Hledáme úsudek.


„Proč by experti přispívali?"

Příjmy. 95 % příjmů od spotřebitelů plyne expertům. Členové cechu získávají plný přístup k AI za $5 místo $20.

AI, která pro ně pracuje. Trénovaná ověřenými experty ve vašem oboru, s retrievalem nad databázemi, které skutečně používáte.

Deset minut, ne změna kariéry. Minimální příspěvek: pětisekundový ano/ne úsudek.


„Proč $5/měsíc? Proč ne zdarma?"

Účtujeme $5, abychom nikdy nemuseli přijmout rizikový kapitál. Žádný investor by nedovolil, aby 95 % plynulo přispěvatelům. Žádný investor by nepřijal ústavu, která zakazuje design nahrazení práce. Těch $5 je cena nezávislosti.

Přispívání je zdarma — kdokoli se může zaregistrovat a dělat rychlé recenze. Členství v cechu ($5/měsíc) odemyká plné nástroje pro recenze, přístup k AI a podíl na příjmech.


„95 % expertům — jak je to udržitelné?"

Dva zdroje příjmů. Poplatky cechu ($5/měsíc za experta) financují hlavní tým. Společnost také dostává 5 % příjmů od spotřebitelů. Ústava to garantuje — společnost nemůže zvýšit svůj podíl nad 5 % bez supermajoritního hlasování členů cechu. Náklady na infrastrukturu jsou zveřejňovány měsíčně.


„Co tohle umí a ChatGPT ne?"

Pět věcí, které žádný velký model nemůže garantovat:

  1. Atribuce zdroje. Každé tvrzení vede ke jmenovanému expertovi, který ho ověřil.
  2. Deterministický výpočet. Daňové sazby, dávkování léků, stavební kódy — počítáno, ne predikováno.
  3. Časová platnost. Jednotky expirují, když se zákon změní. Velké modely sebejistě citují loňská pravidla.
  4. Jurisdikční specifičnost. České daňové právo není německé daňové právo. Jeden model nemůže obsloužit oboje.
  5. Souhlas a kompenzace. Každý expert, který přispěl, je jmenován, souhlasil a je placen.

„Co když se velké modely prostě zlepší?"

Propast je architektonická, ne výkonnostní náskok. Velké modely predikují, jak odpovědi vypadají. My kompilujeme, jak profesionálové skutečně uvažují — do ověřených jednotek, které se spouštějí deterministicky. Velký model se může zlepšit v hádání správného daňového výpočtu. Náš systém daňový výpočet spouští. To je strukturální vlastnost, ne náskok, který se stírá.

Základní model se zlepší — nasadíme ho. Expertní uvažování je příkop, ne váhy modelu.


„Které profese nepokrýváte?"

Záměrně: softwarové inženýrství, datová věda, design, manažerské poradenství, kreativní práce. To jsou oblasti, kde LLM již fungují dobře. My budujeme pro 124 profesí, kde je AI nejslabší — pravidlově hutné, jurisdikčně specifické, s vysokými sázkami.


„Jak zabráníte gamingu?"

Tři vrstvy: automatická detekce anomálií (duplikáty, objemové anomálie, plagiátorství), peer review (každý příspěvek recenzován 2+ ověřenými profesionály) a ověření kredenciálů (licence, certifikace nebo titul — recenzováno doménovým governance výborem). Objem bez kvality nevydělá nic.


„Tohle zní jako krypto."

Žádný token. Žádný blockchain. Žádná spekulace. Body jsou trvalé, nepřevoditelné, neobchodovatelné. Odrážejí ověřený profesní příspěvek, ne pozici k prodeji. $5/měsíc pro experty. $20/měsíc pro spotřebitele. Transparentní náklady. Ústavní ochrana.


„Jeden člověk tohle nemůže postavit."

Jeden člověk to začal. Ústava zajišťuje, že žádný jeden člověk to nekontroluje. Expertní komunity řídí své domény. Ústavní omezení zabraňují zabavení bez ohledu na to, kdo společnost vede.


Stále nejste přesvědčeni? Přečtěte si Ústavu — je to nejkratší cesta k tomu, abyste zjistili, jestli to myslíme vážně.

Přispívejte zdarma · Vstupte do cechu — $5/měsíc