kNN

在统计学中,k最近邻算法(k-NN)open in new window是一种非参数的监督学习方法,最早由Evelyn Fix和Joseph Hodges于1951年开发,后来由Thomas Cover扩展。它用于分类和回归问题。

本文介绍了如何使用底层使用kNN的检索器。

主要参考自 https://github.com/karpathy/randomfun/blob/master/knn_vs_svm.ipynb

from langchain.retrievers import KNNRetriever
from langchain.embeddings import OpenAIEmbeddings

创建新的检索器并添加文本

retriever = KNNRetriever.from_texts(["foo", "bar", "world", "hello", "foo bar"], OpenAIEmbeddings())

使用检索器

现在我们可以使用检索器了!

result = retriever.get_relevant_documents("foo")
result
[Document(page_content='foo', metadata={}),
 Document(page_content='foo bar', metadata={}),
 Document(page_content='hello', metadata={}),
 Document(page_content='bar', metadata={})]
Last Updated:
Contributors: 刘强