AI Bits – GBrain

Za projektem stojí Garry Tan, president Y Combinator — akcelerátoru, který stál u zrodu Coinbase, Instacart nebo Rippling. Tan aktuálně provozuje YC na plný úvazek a zároveň aktivně vyvíjí vlastní nástroje. GBrain je jeho open source odpověď na problém, který zná každý, kdo pracuje s větším množstvím poznámek: markdown soubory jsou roztroušené po repozitářích, Obsidian vaultech a Notion databázích a nedají se rozumně prohledávat.

GBrain řeší prohledávání pomocí hybridního přístupu, který kombinuje vektorové vyhledávání a keyword search. Samotné keyword search nestačí — sémantické shody se ztrácí. Samotné vektorové vyhledávání zase mine přesné výrazy a jména. GBrain fusuje oba přístupy přes RRF (Reciprocal Rank Fusion) a navíc rozšiřuje dotaz přes Claude Haiku na více variant, aby zachytil i formulace, na které uživatel sám nepřišel. AI agenti udržují znalostní bázi aktuální: po importu dokumentu agent aktualizuje všechny zmíněné entity, vytvoří cross-reference linky a doplní timeline záznamy. Výsledek je přístupný přes MCP server s 21 nástroji — kompatibilní s Claude Code, Cursor i dalšími klienty.

Import 7 000 souborů trvá přibližně 30 sekund, embedding přibližně 10–15 minut. Pro brain o velikosti 7 500 stránek vychází celková velikost databáze přibližně na 750 MB — z toho embeddings tvoří ~134 MB a HNSW index ~270 MB. Počáteční náklady na embedding přes OpenAI text-embedding-3-large vychází na přibližně 4–5 USD. Jako databázový backend slouží Supabase Pro za 25 USD měsíčně (8 GB úložiště). GBrain je open source pod MIT licencí, dostupný jako CLI, knihovna i MCP server.


Zdroje:

Loading