トップ Flaskに関する質問 RAG型チャットボットで誤回答を訂正した内容を蓄積し賢くする仕組みは可能か？（Gemini API・画像入力あり）

編集履歴

質問編集履歴

migrate_to_chroma.pyを記載し、文字数制限のためindex.htmlを削除

2026/04/09 02:40

投稿

loving

スコア54

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -332,102 +332,89 @@
 ```
 ```index.html
-<!DOCTYPE html>
-<html>
-<head>
-<meta charset="UTF-8">
-<title>外部案件検索</title>
-</head>
+//文字数制限のため省略
+```
+```migrate_to_chroma.py
+import sqlite3
+import chromadb
-<body>
+import requests
+import os
+from dotenv import load_dotenv
+load_dotenv()
-<h1>ナレッジ検索</h1>
+GEMINI_API_KEY = os.getenv("GEMINI_API_KEY")
-<!-- ===== 検索フォーム ===== -->
+def get_embedding(text: str):
-<form method="POST" action="/ask" enctype="multipart/form-data">
+    url = f"https://generativelanguage.googleapis.com/v1beta/models/text-embedding-004:embedContent?key={GEMINI_API_KEY}"
-  <p>質問：</p>
-  <input type="text" name="question" style="width:400px;" required>
+    payload = {
-  <p>質問の画像（任意）：</p>
+        "model": "models/text-embedding-004",
-  <input type="file" name="image">
+        "content": {"parts": [{"text": text}]}
+    }
-  <br><br>
-  <button type="submit">検索</button>
+    res = requests.post(url, json=payload)
-</form>
+    res.raise_for_status()
-<hr>
+    return res.json()["embedding"]["values"]
-<!-- ===== AI回答 ===== -->
-{% if answer %}
-  <h2>AI回答</h2>
-  <p>{{ answer }}</p>
-  <hr>
-{% endif %}
-<!-- ===== 根拠表示 ===== -->
-{% if results %}
+def migrate():
-  <h2>根拠（事例・マニュアル）</h2>
+    conn = sqlite3.connect("db.sqlite")
-  {% for r in results %}
+    cur = conn.cursor()
-    <div style="margin-bottom:30px; border:1px solid #ccc; padding:10px;">
+    cur.execute("""
-      <p><b>類似度:</b> {{ r.score }}</p>
+        SELECT id, type, question, content, answer, page, image_path
+        FROM knowledge
+    """)
-      <!-- ===== 事例 ===== -->
-      {% if r.type == "case" %}
+    rows = cur.fetchall()
-        <p style="color:blue;"><b>【事例】</b></p>
+    conn.close()
-        {% if r.question %}
-          <p><b>質問:</b><br>{{ r.question }}</p>
+    chroma = chromadb.PersistentClient(path="./chroma_db")
-        {% endif %}
+    collection = chroma.get_or_create_collection(
+        name="knowledge",
-        <p><b>回答:</b><br>{{ r.answer }}</p>
+        metadata={"hnsw:space": "cosine"}
+    )
-        {% if r.image %}
+    for row in rows:
-          <img src="{{ url_for('static', filename='images/cases/' + r.image) }}" width="300">
+        id_, type_, question, content, answer, page, image = row
-        {% else %}
-          <p>画像なし</p>
-        {% endif %}
-      {% endif %}
-      <!-- ===== マニュアル ===== -->
+        # ★ embedding対象（ここ重要）
-      {% if r.type == "manual" %}
-        <p style="color:green;"><b>【マニュアル】</b></p>
+        text = f"{question or ''} {content or ''} {answer or ''}".strip()
-        {% if r.content %}
+        if not text:
-          <p><b>内容:</b><br>{{ r.content }}</p>
-        {% endif %}
+            continue
-        <p><b>回答:</b><br>{{ r.answer }}</p>
+        print("Embedding:", text[:50])
-        {% if r.page %}
+        embedding = get_embedding(text)
-          <p><b>ページ:</b> {{ r.page }}</p>
-        {% endif %}
-        {% if r.image %}
+        collection.add(
+            ids=[str(id_)],
-          <img src="{{ url_for('static', filename='images/manual/' + r.image) }}" width="300">
+            embeddings=[embedding],
-        {% else %}
+            documents=[text],
+            metadatas=[{
-          <p>画像なし</p>
+                "type": type_ or "",
+                "question": question or "",
+                "content": content or "",
+                "answer": answer or "",
+                "page": str(page) if page else "",
-        {% endif %}
+                "image": image or ""
-      {% endif %}
+            }]
+        )
-    </div>
+    print("✅ 移行完了")
-    <hr>
-  {% endfor %}
+if __name__ == "__main__":
-{% endif %}
+    migrate()
-</body>
-</html>
-```
-```migrate_to_chroma.py
-文字数制限で全部貼れないため省略
 ```
 ### 試したこと・調べたこと

Flask AI（人工知能）機械学習 Python

migrate_to_chroma.pyについて漏れていたため修正

2026/04/09 02:33

投稿

loving

スコア54

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -422,7 +422,14 @@
 </body>
 </html>
 ```
+```migrate_to_chroma.py
+文字数制限で全部貼れないため省略
+```
 ### 試したこと・調べたこと
 - [ ] teratailやGoogle等で検索した
 - [x] ソースコードを自分なりに変更した

Flask AI（人工知能）機械学習 Python

文法の修正

2026/04/08 12:37

投稿

loving

スコア54

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -1,6 +1,4 @@
-```ここに言語を入力
-コード
-```### 実現したいこと
+### 実現したいこと
 完全無料かつクレジットカード登録なしで、業務用チャットボットを構築したいと考えています。
 対象は外部案件で、業務マニュアルやQ&Aが存在します。

Flask AI（人工知能）機械学習 Python

一部修正

2026/04/08 11:35

投稿

loving

スコア54

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -1,4 +1,6 @@
+```ここに言語を入力
+コード
-### 実現したいこと
+```### 実現したいこと
 完全無料かつクレジットカード登録なしで、業務用チャットボットを構築したいと考えています。
 対象は外部案件で、業務マニュアルやQ&Aが存在します。
@@ -266,9 +268,9 @@
 # ===== マニュアル =====外部案件のためマニュアルや事例の内容はダミーにしてあります
 manual_data = [
     {
-    "content": "差額や警告マークがない場合の処理",
+    "content": "赤線や青線がない場合の処理",
-    "keywords": "OK,差額なし,警告なし",
+    "keywords": "赤線,青線,
-    "answer": "差額や警告マークがなければ、そのままSaveする。",
+    "answer": "赤線や青線がなければそのままSaveする。",
     "image_path": "3.png",
     "page": 3,
     "section":"(1) 処理手順"

Flask AI（人工知能）機械学習 Python

一部修正

2026/04/08 11:20

投稿

loving

スコア54

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -16,7 +16,7 @@
 を知りたいです。
 ### 発生している問題・分からないこと
-この案件ではレシート画像などの画像情報が非常に重要で、
+この案件では伝票画像などの画像情報が非常に重要で、
 回答は「質問文」ではなく「画像の内容」を基準に判断する必要があります。
 ただし、OCRでは読み取り精度に限界があり、正確にテキスト化できないケースも多いため画像フォルダにマニュアル画像を入れてAPIに渡しています。

Flask AI（人工知能）機械学習 Python

マニュアルの画像の渡し方について訂正

2026/04/08 08:25

投稿

loving

スコア54

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -18,7 +18,7 @@
 ### 発生している問題・分からないこと
 この案件ではレシート画像などの画像情報が非常に重要で、
 回答は「質問文」ではなく「画像の内容」を基準に判断する必要があります。
-ただし、OCRでは読み取り精度に限界があり、正確にテキスト化できないケースも多いです。
+ただし、OCRでは読み取り精度に限界があり、正確にテキスト化できないケースも多いため画像フォルダにマニュアル画像を入れてAPIに渡しています。
 さらに問題として、
 質問者の前提が誤っているケース（例：対象外と書かれていないのに対象外だと思い込んでいる）が多く、

Flask AI（人工知能）機械学習 Python