随笔分类 - dev-ai
摘要:运行openai相关api的时候,需要用到代理。 key就在环境变量中建立:OPENAI_API_KEY 和 OPENAI_PROXY 在pycharm中如果想让整个python运行的时候都走代理,可以设置Environment Variables:http_proxy=http://127.0.0
阅读全文
摘要:from: https://weaviate.io/blog/distance-metrics-in-vector-search Vector databases - like Weaviate - use machine learning models to analyze data and ca
阅读全文
摘要:组件地址:https://github.com/pgvector/pgvector 我的机器是MacOS,下载的postgreSQL是15,按理下载下来是自动安装了pgvector,但是测试的时候发现并没有这个extension。 按文档执行: make -- 报错,clang: error: un
阅读全文
摘要:参考: https://blog.csdn.net/LuohenYJ/article/details/131965198 (good) https://blog.csdn.net/qq_33578950/article/details/130157831
阅读全文
摘要:这篇文章很好,介绍了how word2vec works. https://gist.github.com/aparrish/2f562e3737544cf29aaf1af30362f469 非常棒的一篇文章,作者介绍了vector如何计算的,也介绍了几个常用的库,这些库可以用来得到vectors,
阅读全文
摘要:直接用LLM是不精确的,需要结合graph DB+LLM,参见: https://medium.com/neo4j/harnessing-large-language-models-with-neo4j-306ccbdd2867 https://neo4j.com/developer-blog/fi
阅读全文
摘要:What are embeddings? Text embeddings are a natural language processing (NLP) technique that converts text into numerical vectors. Embeddings capture s
阅读全文
摘要:来源: https://blog.langchain.dev/tutorial-chatgpt-over-your-data/ https://github.com/hwchase17/chat-your-data High Level Walkthrough At a high level, th
阅读全文
摘要:see: Retrievers | 🦜️🔗 Langchain https://blog.langchain.dev/retrieval/ 按文档说的Retriever就是一个接口,可以把和query相关的文档都查询出来,而vectorDB是否成retriever的关键组件之一。
阅读全文