[B! RAG] nagggのブックマーク

RAGの検索性能を90％も低下させるテキストの落とし穴

導入こんにちは、株式会社ナレッジセンスの須藤英寿です。今回は、RAGの要であるEmbeddingの性能を大きく低下させてしまう、文章の特性について解説します。このブログで紹介している内容は以下の論文を元に作成しておりますので、詳細はそちらをご確認ください。RAGを構成してみたが、どうしても正解の文章を取ってこれない！そんなときはもしかするとこの論文で紹介されているような文章になってしまっているかもしれません。サマリー Embeddingは、RAGの検索能力の根幹に関わる機能ですが、そのの性能や特性についてはあまり知られてはいません。実は、保管するテキストの文体や分割方法次第で最大90％程度、検索性能が下がってしまいます。今回紹介する論文では、Embeddingの性能を著しく下げるテキストの特徴を調べ、その性質についてまとめています。特に「文章の位置」、「使用する単語」、「文章量」

naggg 2025/03/18

AI
RAG

リンク

RAGで「無関係な」文書を入れると、逆に精度が上がる

本記事では、RAGの性能を高めるために「あえてノイズを注入する」手法について、ざっくり理解します。株式会社ナレッジセンスは、エンタープライズ企業向けにRAGを提供しているスタートアップです。この記事は何 OpenAIがリリースした「Deep Research」[1]という機能が話題です。その中で、「AIが、全然関係ない思考を挟んでいる」という、興味深い報告がされています。[2] そして面白いのは、OpenAIが意図的にそうしている可能性が指摘されていることです。そこで、この記事では、上記の根拠として挙げられている論文[3]について、日本語で簡単にまとめます。今回も「そもそもRAGとは？」については、知っている前提で進みます。確認する場合はこちらの記事もご参考下さい。本題ざっくりサマリーこの論文は、RAGシステムにおいて、ノイズ（=無関係な文書）が与える影響を分析したものです。サ

naggg 2025/02/25

もっと大規模なパラメータだとどうなるんだろ？？ → “Llama2-7B、MPT-7B、Phi-2、Falcon-7B の4種類のLLMを利用します。”

リンク

Ask! NIKKEI RAG検索技術の深層

Ask! NIKKEI RAG検索技術の深層という内容で、#nikkei_tech_talk で発表した資料です。検索システムでは、前処理でのクエリ展開・1stフェイズのハイブリット検索(マルチリンガルモデル + 日経用SPLADEモデル)、2ndフェイズの日経Judgeモデル(LLMの評価スコ…

naggg 2025/02/07

すご、エンコーダーつくってんのか

リンク

RAGで「AIエージェント」を使う手法まとめ

本記事では、RAGの性能を高めるための「Agentic RAG」という手法について、ざっくり理解します。株式会社ナレッジセンスは、エンタープライズ企業向けにRAGを提供しているスタートアップです。この記事は何この記事は、「AIエージェント」をRAGに取り入れた手法である「Agentic RAG」のサーベイ論文[1]について、日本語で簡単にまとめたものです。今回も「そもそもRAGとは？」については、知っている前提で進みます。確認する場合はこちらの記事もご参考下さい。本題ざっくりサマリー Agentic RAG は、RAGの新しい手法です。この論文では、「RAGにAIエージェントを使っている」とはどういう状態なのか、どんなパターンがあるのかまとめられています。クリーブランド・ステート大学の研究者らによって、2025年1月に発表された論文です。最近、「AIエージェント」が注目されてい

naggg 2025/01/31

たしかに2023年頃からある手法っちゃ手法

リンク

【メモ】RAGシステム構築の強い味方 - Doclingによるドキュメント変換入門 - uepon日々の備忘録

IBM watsonx.ai DojoでRAGとして様々なファイルのフォーマットを使用するための変換ツールを紹介していただきました。それが今回紹介するDoclingです😊 Doclingとは？ Doclingは、簡単にいうならば様々なドキュメントに対応したHTML、Markdown、JSONへのコンバートツールになります。 ds4sd.github.io 【Doclingの特徴】一般的な文書フォーマット（PDF、DOCX、PPTX、XLSX、画像、HTML、AsciiDoc、Markdown）を読み取り、HTML、Markdown、JSON（埋め込み画像や参照画像付き）にコンバート可能ページレイアウト、読み取り順序、表構造を含む高度なPDF文書理解の能力もつ DoclingDocumentを使用することで、統一性と表現性を実現 LangChain、LlamaIndex、Crew A

naggg 2025/01/21

デフォルトはマークダウンへ変換

AI
RAG

リンク

Top 21 Famous RAG Frameworks in 2025

🚀 Join a global community of AI enthusiasts, professionals, and industry leaders as we break down cutting-edge advancements in Artificial Intelligence, Machine Learning, and Data Science. Stay ahead with expert insights, hands-on knowledge, and future-driven innovations!

naggg 2025/01/19

AI
RAG

リンク

RAG普及で加速する製造業のナレッジ活用　技術継承への貢献にも期待

RAG（Retrieval Augmented Generation：検索拡張生成）を社内で活用する企業が増えている。エクサウィザーズが2024年12月に公開したレポートによれば、同社セミナー参加者の内、「RAGを業務で活用している」と回答した企業は22.1％に上った。同年5月に実施した調査では4.0％であったことから、短期間で大幅にRAG活用が進んでいる様子がうかがえる。製造業に限って見ても、試験的な導入を超えてRAG活用を本格化させようとする動きは非常に活発化している。これは、生成AIの効果的な活用を推進する上で、社内に蓄積されたデータやナレッジの活用が極めて重要だと多くの企業が気付き、すでにアクションを起こしていることの表れであろう。 RAG以外にも生成AIの回答精度を高める新規技術が登場している。その意味で、今後もRAGが生成AI活用に欠かせない強力なツールであり続けられるのかま

naggg 2025/01/10

リンク

AIエージェントの発展とRAGの新境地、「エージェンティックRAG」が注目される理由 | AMP[アンプ] - ビジネスインスピレーションメディア

既存RAGの課題、ハルシネーションやコンテキスト理解不足など企業における生成AI活用では、情報の正確性が特に重視される。そのため、生成AIを利用する場合、検索拡張生成（RAG）の導入が一般的となっている。RAGとは、生成AIに外部データベースを接続することで、より正確な回答を生成する手法。RAGは特に文書要約やシンプルなクエリへの回答で優れたパフォーマンスを発揮するといわれている。しかし、既存のRAGシステムには、いくつかの課題が存在する。課題は大きく4つに分類される。第1の課題は、RAGだけでは情報の正確性が担保できないことだ。たとえば、営業担当者が商談の売上を問い合わせた場合、チャットログやメール、CRMなど、複数のデータソースが参照対象に含まれる。この場合、CRMが最も信頼できる情報源となるはずだが、RAGシステムは、自律的にそのことを判断できないため、古いメールから誤った情報

naggg 2025/01/02

リンク

RAG技術の現状考察と2025年のトレンド予想

本記事では、現在流行している「RAG」技術について、2024年トレンドの振り返りと、2025年の予想をします。株式会社ナレッジセンスは、エンタープライズ企業向けにRAGを提供しているスタートアップです。この記事は何 2024年は、RAGが大流行した年でした。この記事では、2024年の技術トレンドを振り返りつつ、2025年のRAGの進展を予想したいと思います。技術的トレンドはもちろん、普段、企業向けにRAGを提供している会社としての、僕の肌感覚も合わせて、お伝えできればと思います。本題ざっくりサマリー結論として、RAGは、来年も変わらず流行し続けると予想します。まず来年は、これまで以上に回答精度が向上するのは間違いないです。その理由は、LLMの価格低下トレンドと入力できるコンテキスト増大トレンドが、まだ続くためです。加えて、LLMが「視覚・音声」の入力手段を獲得したこと、ベクトルD

naggg 2024/12/24

AI
RAG

リンク

【AWS re:Invent 2024】RAG 関連の5個のセッションの学びを濃縮してお届けします - カミナシエンジニアブログ

こんにちは、AWS re:Invent から帰国した a2 (@Atsuhiro_tim) です。すき家がサラダをつけても $5 で、その美味しさと安さに涙を流しています。さて、AWS re:Invent 2024 のセッションカタログを見ると、今年も GenAI が猛威を振るっていたことがわかります。昨年は Gen AI x 〇〇が多かったのですが、今年は一歩進んで、 RAG x 〇〇や Agent x 〇〇が出てきました。RAG については機能リリースのニュースは認識していたものの、実際に触ることがなかったので、今回の re:Invent で Gen AI や RAG 関連のセッションに参加してきました。複数のセッションの学びをまとめてシェアしたいと思います。参加したセッション： Explore generative AI use cases with LangChain

naggg 2024/12/23

AI
RAG

リンク

RAG-1グランプリ 10位解法と振り返り - 質問と関連文書から Q&A システムを設計する｜s-miyawaki

本記事は Algomatic で開催している 2024 年度アドベントカレンダーの一枠として投稿しています！弊社員による投稿もよければご覧ください 🎄📅 コンペ概要投稿数：3,634件参加人数：1,464人トップスコア推移（https://signate.jp/competitions/1407/leaderboard#scoregraph）タスク概要著作権が切れた 7 作品の小説データを対象とする長文読解タスク与えられた質問に対して小説から該当する解答を生成する GPT-4o が解答の正確性を分類して最終スコアが LB に反映されるなお LLM-as-a-Judge や人が作問している以上、表層レベルでの判定誤りが発生する可能性は許容しないといけない正確性の分類（https://signate.jp/competitions/1407#evaluation よ

naggg 2024/12/06

AI
RAG

リンク

【ServerlessDays 2024】生成AIアプリ実装におけるトレンド3選 - Qiita

・機能の多様化&複雑化・生成AIに仕事の一部を任せる・ハルシネーションは許されなくなっていく・出力内容の評価も生成AIが行う・人間は更なる精度向上を求める・生成AIを使いこなす技術力と知識が必要・AIがAIを使う時代へこのように移り変わっていくフェーズが来ている、と個人的には感じました。ここからは、前述した3つのトレンドについて、1つずつ掘り下げていきます。 LLMが生成した出力を、LLMで評価する例えば「オンライン薬局のLLMマルチエージェントを支えるLLM Ops」というセッションでは、患者さんとメッセージをやり取りする薬剤師さんに対して、返信のレコメンド文をLLMに出力させるという取り組みをされていました。このサービスにおけるミッションは「漢方をお客様に販売すること」なので、虚偽・不正確な情報が入っていては困ります。 LLMが生成したメッセージを薬剤師さんがチェッ

naggg 2024/09/24

AI
RAG

リンク

ガートナージャパンが「日本における未来志向型インフラ・テクノロジのハイプ・サイクル：2024年」発表。Web3やNFTは幻滅期、生成AIは過度な期待、汎用AIは黎明期

ガートナージャパンが「日本における未来志向型インフラ・テクノロジのハイプ・サイクル：2024年」発表。Web3やNFTは幻滅期、生成AIは過度な期待、汎用AIは黎明期調査会社のガートナージャパンは、「日本における未来志向型インフラ・テクノロジのハイプ・サイクル：2024年」を発表しました。ハイプサイクルとはガートナーのハイプサイクルは、技術の登場から安定までを5つのステージに分けて説明したものです。5つのステージは、「黎明期」から始まり、「『過度な期待』のピーク期」「幻滅期」「啓発期」「生産性の安定期」まで。この途中で消えていく技術もあります。米調査会社のガートナーはグローバルな視点で毎年「先進テクノロジのハイプ・サイクル」を発表していますが（今年もおそらく間もなく発表されると思われる）、今回発表されたのは日本において、未来志向型と捉えられるテクノロジやトレンドとなっている40のキ

naggg 2024/08/14

生成AIがピークを越えて、RAGがピークの手前。メタバースは幻滅期を乗り越えるかって感じ。肌感と同じかなぁ。

リンク

生成AIの業務活用のカギはRAG、AIはアルゴリズムから「World Model」へ─専門家が説く現状と将来 | IT Leaders

IT Leaders トップ＞テクノロジー一覧＞ AI ＞インタビュー＞生成AIの業務活用のカギはRAG、AIはアルゴリズムから「World Model」へ─専門家が説く現状と将来 AI AI記事一覧へ [インタビュー] 生成AIの業務活用のカギはRAG、AIはアルゴリズムから「World Model」へ─専門家が説く現状と将来米ガートナーバイスプレジデントアナリストアンソニー・ムレン氏 2024年7月25日(木)田口潤（IT Leaders編集部）リスト生成AIが画期的な技術であることは論を要しない。だれもが簡単に利用でき、文書の作成や要約、翻訳、問い合わせへの回答、アイデア出し、表や図形・画像の自動作成など、さまざまな処理を高いレベルでこなしてくれる。半面、進化の最中にある技術であり、平気で間違えることもあって、業務で効果的に活用するのはそれなりに難しい。企業

naggg 2024/07/25

AI
RAG

リンク

生成AIのRAG構成を大手3社（AWS、Azure、Google Cloud）で徹底比較してみた - G-gen Tech Blog

G-gen の堂原と又吉です。当記事では、Amazon Web Services（AWS）、Microsoft Azure、Google Cloud（旧称 GCP）が提供するフルマネージドな RAG サービスの比較を行います。はじめに当記事について RAG とは 3社比較前提条件機能比較料金シミュレーション想定シナリオ AWS Azure Google Cloud 総評 AWS Azure Google Cloud 詳細の解説 Knowledge bases for Amazon Bedrock（AWS）の詳細構成図プロダクト一覧 Knowledge bases for Amazon Bedrock Amazon S3 Amazon OpenSearch Service できること検索対応データソース料金概要基盤モデル利用料金ベクトルデータベース料金 Azure

naggg 2024/07/24

リンク

実務におけるRAG 〜学びと現場のノウハウ〜 | ドクセル

スライド概要実務においてRAG（Retrieval-Augumented Generation）をたっぷり経験したhoxo-mの学びと現場のノウハウをまとめた

naggg 2024/07/23

リンク

ローカルLLMとRAGで自分の外部記憶を強化しよう - VA Linux エンジニアブログ

はじめに自宅PC編会社サーバ編感想等執筆者：佐藤友昭 ※ 「ディスアグリゲーテッドコンピューティングとは何か?」連載記事一覧はこちらはじめに作業ログや検討メモ、参照した定型論文や書籍、ネット上の記事、視聴した講演やウェビナーのメモ等、日常を記録する情報は日々増えていく。これらの情報はできれば後に役立てたいと思うが、筆者の場合、なかなか上手くいかない。自分の外部記憶を紐解いてみると、記録したことすら忘れてしまっている項目が大半である。本稿では、ローカルLLMとRAGを用いて自分の外部記憶にいろいろと質問できるようにする方法を入門的に紹介する。決してベストプラクティス的な内容ではない。自宅PC編まずは、普段自宅で使用しているLinux PCを実験台として使えそうか試してみてから会社のサーバに適用してみることにする。第一の要件は、ローカル環境で動作することである。情報の性質によ

naggg 2024/07/21

第一の要件：ローカル環境で動作、第二の要件：既存の環境に追加的に導入できること、第三の要件：質問に対してデタラメな返答をしないことである

リンク

エクサウィザーズ、生成AIの回答品質を自社の運用で継続的に改善する「RAGOps」 | IT Leaders

IT Leaders トップ＞テクノロジー一覧＞ AI ＞新製品・サービス＞エクサウィザーズ、生成AIの回答品質を自社の運用で継続的に改善する「RAGOps」 AI AI記事一覧へ [新製品・サービス] エクサウィザーズ、生成AIの回答品質を自社の運用で継続的に改善する「RAGOps」 2024年5月13日(月)日川佳三（IT Leaders編集部）リストエクサウィザーズは2024年5月13日、AIシステム開発ツール「exaBase Studio」のテンプレートとして、AIの回答品質を自社の運用で継続的に改善する「RAGOps」を同年5月から提供すると発表した。品質が高い回答をキャッシュする一方で、品質が低い回答についてはオペレーターが回答を行う仕組みを提供する。入力した回答はデータベースに蓄積され、以降の回答に利用する。回答の品質が求められる用途で活用できるとしている。

naggg 2024/07/19

リンク

[Dify]現状Difyができないこと - Qiita

前提 Difyのバージョンは Dify：0.6.11 Dify：0.6.13です。今の最新バージョンで現状できないことをまとめてみました。いろんな人がXでDifyでできることをあげていってくれていますが、あまりできないことをまとめている人はいなかったのでまとめた次第です。「探索に時間を費やしたけど結局できなかった...」となる人が少なくなること祈って書いています。ループ処理の制限現在のDifyでは、特定の条件を満たすまでループを回す処理の実装が困難です。例えば、Self-RAGのような自己反復型のRAGの実装ができません。一時的解決策現状見つかっていないです。実装方法あったら教えてください。モニタリングツール（LangSmith、Langfuse）との連携 (0.6.12からできるようになりました) できるようになったので、混乱を与えないため内容は削除しました。 AIモデル