導入(YomiTokuとは?/なぜ使う価値があるのか) 近年、AI技術の進歩により画像から文字を読み取るOCR(光学文字認識)が身近になってきました。YomiToku(ヨミトク)は、特に日本語の文書画像解析に特化した新しいOCRライブラリです (YomiToku)。日本語は ...
AIを用いて写真からテキストデータを抽出できる軽量ツール「NDLOCR-Lite」が2月24日、国会図書館の実験的なサービスを提供する「NDLラボ」の公式「GitHub」サイトで公開された。ライセンスは「CC BY 4.0」で、ソースコードも公開済み。適切なクレジット表示さえあれば商用を含め自由に利用できる。
RAG登録時に利用するOpenWebUIデフォルト「コンテンツ抽出エンジン」は精度が悪いと聞きましたので調査して環境変更を実施しました。 Ubuntu+Docker+OpenWebUI+Ollama環境で、Docling+RapidOCRを利用する方法を以下に解説します。 OpenWebUIで利用可能な「コンテンツ抽出 ...
SGシステム株式会社は1日、AIを活用したOCRプラットフォームサービス「Biz-AI×OCR」に、手書きの日本語を高精度に読み取れるAIモデルを搭載し、6月から提供を開始したと発表した。 SGシステムは、佐川急便の配送伝票のサイズ・重量入力業務を自動化するAI-OCRを ...
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する