<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>documentai - Hard Wired</title>
	<atom:link href="https://www.hardwired.dev/tag/documentai/feed/" rel="self" type="application/rss+xml" />
	<link>https://www.hardwired.dev</link>
	<description></description>
	<lastBuildDate>Fri, 10 Apr 2026 10:41:42 +0000</lastBuildDate>
	<language>cs</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=6.9.4</generator>

<image>
	<url>https://www.hardwired.dev/wp-content/uploads/2022/10/android-chrome-256x256-1-150x150.png</url>
	<title>documentai - Hard Wired</title>
	<link>https://www.hardwired.dev</link>
	<width>32</width>
	<height>32</height>
</image> 
	<item>
		<title>AI Bits &#8211; OpenDataLoader PDF</title>
		<link>https://www.hardwired.dev/2026/04/12/ai-bits-opendataloader-pdf/</link>
		
		<dc:creator><![CDATA[John Doe]]></dc:creator>
		<pubDate>Sun, 12 Apr 2026 12:37:18 +0000</pubDate>
				<category><![CDATA[AI]]></category>
		<category><![CDATA[benchmarky]]></category>
		<category><![CDATA[documentai]]></category>
		<category><![CDATA[hancom]]></category>
		<category><![CDATA[LangChain]]></category>
		<category><![CDATA[LLM]]></category>
		<category><![CDATA[opensource]]></category>
		<category><![CDATA[pdfparser]]></category>
		<category><![CDATA[RAG]]></category>
		<guid isPermaLink="false">https://www.hardwired.dev/?p=3021</guid>

					<description><![CDATA[<p>OpenDataLoader PDF je open-source parser PDF pro AI aplikace. Převádí dokumenty do strukturovaných formátů jako JSON nebo Markdown. Kdo za &#62;&#62;&#62;</p>
<p>The post <a href="https://www.hardwired.dev/2026/04/12/ai-bits-opendataloader-pdf/">AI Bits – OpenDataLoader PDF</a> first appeared on <a href="https://www.hardwired.dev">Hard Wired</a>.</p>]]></description>
										<content:encoded><![CDATA[<div id="bsf_rt_marker"></div><p>OpenDataLoader PDF je open-source parser PDF pro AI aplikace. Převádí dokumenty do strukturovaných formátů jako JSON nebo Markdown.</p>
<h2>Kdo za projektem stojí</h2>
<p>Projekt vede OpenDataLoader Project na GitHubu (opendataloader-project). Vydavatel je Hancom Inc., která v březnu 2026 vydala verzi 2.0 s vylepšeným motorem.</p>
<h2>K čemu slouží</h2>
<p>Parser extrahuje text, tabulky, obrázky a layout do formátů pro RAG, LLM a vektorovky. Běží lokálně bez GPU, filtruje bezpečnostní rizika a podporuje LangChain integraci. Usnadňuje zpracování velkých sad PDF pro AI workflow.</p>
<h2>Čísla a benchmarky</h2>
<p>Verze 2.0 vede open-source benchmarky s celkovým skórem 0.90. Nabízí vysoký throughput díky heuristické inferenci, bez cloud závislosti.</p>
<table>
<thead>
<tr>
<th>Výstup</th>
<th>Funkce</th>
<th>Použití</th>
</tr>
</thead>
<tbody>
<tr>
<td>JSON</td>
<td>Layout + bounding boxy</td>
<td>RAG DB</td>
</tr>
<tr>
<td>Markdown</td>
<td>Struktura + obrázky</td>
<td>LLM</td>
</tr>
<tr>
<td>HTML</td>
<td>Stylovaný</td>
<td>Web</td>
</tr>
</tbody>
</table>
<h2>Zdroje</h2>
<ul>
<li><a href="https://github.com/opendataloader-project/opendataloader-pdf[1">https://github.com/opendataloader-project/opendataloader-pdf[1</a>]</li>
<li><a href="https://www.npmjs.com/package/@opendataloader/pdf[2">https://www.npmjs.com/package/@opendataloader/pdf[2</a>]</li>
<li><a href="https://pdfa.org/opendataloader-pdf-v20-tops-open-source-pdf-benchmarks-in-pdf-data-loading/[3">https://pdfa.org/opendataloader-pdf-v20-tops-open-source-pdf-benchmarks-in-pdf-data-loading/[3</a>]</li>
<li><a href="https://docs.langchain.com/oss/python/integrations/document_loaders/opendataloader_pdf[5">https://docs.langchain.com/oss/python/integrations/document_loaders/opendataloader_pdf[5</a>]</li>
<li><a href="https://opendataloader.org[6">https://opendataloader.org[6</a>]</li>
<li><a href="https://github.com/opendataloader-project[4">https://github.com/opendataloader-project[4</a>]</li>
</ul>

<div class="twitter-share"><a href="https://twitter.com/intent/tweet?url=https%3A%2F%2Fwww.hardwired.dev%2F2026%2F04%2F12%2Fai-bits-opendataloader-pdf%2F&#038;via=hessevalentino" class="twitter-share-button">Tweet</a></div><p>The post <a href="https://www.hardwired.dev/2026/04/12/ai-bits-opendataloader-pdf/">AI Bits – OpenDataLoader PDF</a> first appeared on <a href="https://www.hardwired.dev">Hard Wired</a>.</p>]]></content:encoded>
					
		
		
			</item>
	</channel>
</rss>
