AndrewVFranco · AndrewVFranco · Apr 8, 2026 · Apr 8, 2026 · Apr 8, 2026 · Apr 8, 2026
diff --git a/.env.example b/.env.example
@@ -5,8 +5,8 @@ OLLAMA_SERVER_PORT=11434
 OLLAMA_MODEL=llama3.2
 OLLAMA_MAX_TOKENS=1024
 OLLAMA_TEMPERATURE=0.1
-CHROMA_DB_LOCATION=data/chroma_db
-CHROMA_COLLECTION_NAME=pubmed_abstracts
+PINECONE_API_KEY=your_key_here
+PINECONE_INDEX_NAME=your_index_name
 MLFLOW_TRACKING_URI=http://localhost:5000
 MLFLOW_ARTIFACT_LOCATION=logs/mlflow
 FASTAPI_HOST=0.0.0.0

diff --git a/requirements.txt b/requirements.txt
@@ -15,6 +15,20 @@ pytest>=9.0.0
 requests>=2.33.0
 lxml>=6.0.2
 
-# ChromaDB
-chromadb>=0.4.0
-sentence-transformers>=2.2.0
+# Pinecone
+pinecone>=3.0.0
+
+# BioBERT embedding model
+sentence-transformers>=2.2.0
+
+# Agent framework
+langchain>=0.2.0
+langchain-openai>=0.1.0
+langchain-community>=0.2.0
+langgraph>=0.1.0
+
+# Redis caching
+redis>=5.0.0
+
+# OpenAI LLM
+openai>=1.0.0
diff --git a/src/core/config.py b/src/core/config.py
@@ -15,9 +15,9 @@ class Settings(BaseSettings):
     OLLAMA_MAX_TOKENS: int = 1024
     OLLAMA_TEMPERATURE: float = 0.1
 
-    # ChromaDB
-    CHROMA_DB_LOCATION: str = str(Path(__file__).resolve().parent.parent.parent / "data" / "chroma_db")
-    CHROMA_COLLECTION_NAME: str = "pubmed_abstracts"
+    # Pinecone
+    PINECONE_API_KEY: str
+    PINECONE_INDEX_NAME: str
 
     # MLflow
     MLFLOW_TRACKING_URI: str = "http://localhost:5000"

diff --git a/src/retrieval/vector_store.py b/src/retrieval/vector_store.py
@@ -1,7 +1,9 @@
-import chromadb
+from pinecone import Pinecone
 from sentence_transformers import SentenceTransformer
 from src.core.config import settings
 import os
+from src.retrieval.pubmed import search_pubmed
+import sys
 
 os.environ["HUGGING_FACE_HUB_TOKEN"] = settings.HF_TOKEN
 model = SentenceTransformer("pritamdeka/BioBERT-mnli-snli-scinli-scitail-mednli-stsb")
@@ -16,30 +18,41 @@ def _embed_text(text: str) -> list[float]:
 def get_collection():
     global _collection
     if _collection is None:
-        print(settings.CHROMA_DB_LOCATION)
-        client = chromadb.PersistentClient(path=settings.CHROMA_DB_LOCATION)
-        _collection = client.get_or_create_collection(name=settings.CHROMA_COLLECTION_NAME)
+        pc = Pinecone(api_key=settings.PINECONE_API_KEY)
+        _collection = pc.Index(settings.PINECONE_INDEX_NAME)
     return _collection
 
 
 def add_abstracts(abstracts: list[dict]):
-    ids = []
-    embeddings = []
-    documents = []
-    metadatas = []
+    data_list = []
 
     for item in abstracts:
-        ids.append(item["pmid"])
-        embeddings.append(_embed_text(item["abstract"]))
-        documents.append(item["abstract"])
-        metadatas.append({"pmid": item["pmid"], "title": item["title"]})
-
-    get_collection().add(ids=ids, embeddings=embeddings, documents=documents, metadatas=metadatas)
+        data = {'id': item["pmid"],
+                'values': _embed_text(item["abstract"]),
+                'metadata': {
+                    "title": item["title"],
+                    "abstract": item["abstract"],
+                    "pmid": item["pmid"]
+                    }
+                }
+        data_list.append(data)
+
+    get_collection().upsert(vectors=data_list)
 
 def query_abstracts(query: str, n_results: int = 5) -> list[dict]:
     embedding = _embed_text(query)
     results = get_collection().query(
-        query_embeddings=[embedding],
-        n_results=n_results
+        vector=embedding,
+        top_k=n_results,
+        include_metadata=True
     )
     return results
+
+def main():
+    search_results = search_pubmed("myocardial infarction", max_results=5)
+    add_abstracts(search_results)
+    results = query_abstracts("chest pain treatment")
+    print(results)
+
+if __name__ == "__main__":
+    sys.exit(main())