codelab-github-ticket-bot/model.py at master · random-logic/codelab-github-ticket-bot · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
import os
from typing import Sequence
import ollama

from dotenv import load_dotenv
load_dotenv()

EMBEDDING_MODEL = os.environ.get('EMBEDDING_MODEL', 'hf.co/CompendiumLabs/bge-base-en-v1.5-gguf')
LANGUAGE_MODEL = os.environ.get('LANGUAGE_MODEL', 'hf.co/bartowski/Llama-3.2-1B-Instruct-GGUF')

class Model:
  def __init__(self, embedding_model = EMBEDDING_MODEL, language_model = LANGUAGE_MODEL):
    # Each element in the VECTOR_DB will be a tuple (chunk, embedding)
    # The embedding is a list of floats, for example: [0.1, 0.04, -0.34, 0.21, ...]
    self.vector_db = []
    self.embedding_model = embedding_model
    self.language_model = language_model

  def add_chunk_to_database(self, chunk: str | Sequence[str]):
    embedding = self.embed(chunk)
    self.vector_db.append((chunk, embedding))

  @staticmethod
  def cosine_similarity(a, b):
    dot_product = sum([x * y for x, y in zip(a, b)])
    norm_a = sum([x ** 2 for x in a]) ** 0.5
    norm_b = sum([x ** 2 for x in b]) ** 0.5
    return dot_product / (norm_a * norm_b)

  def retrieve(self, query: str, top_n = 1):
    query_embedding = self.embed(query)

    # temporary list to store (chunk, similarity) pairs
    similarities = []

    for chunk, embedding in self.vector_db:
      similarity = self.cosine_similarity(query_embedding, embedding)
      similarities.append((chunk, similarity))

    # sort by similarity in descending order, because higher similarity means more relevant chunks
    similarities.sort(key=lambda x: x[1], reverse=True)

    return similarities[:top_n]

  def embed(self, text: str):
    embeddings = ollama.embed(model=self.embedding_model, input=text)['embeddings']
    return embeddings[0]