RAG 不准就自己用faiss从头写一个...

  • Transformer-周
  • 2024-11-24 07:10:31
RAG 不准就自己用faiss从头写一个,逻辑是一个标准的工程化思路,我以前就说过,问题的L2距离和所谓答案的L2距离相比一定是与类似问题的L2更接近。所以再切chunk之后先让gpt4o mini去针对每个chunk提3个问题,然后把问题向量化,再做一个相关的文档与这个问题的链表,这样新问题来了就可以匹配问题的L2距离,一定比文档的L2距离更近,为了防止llm没提供足够的问题,我又加了文档的L2距离,可以同时匹配6个相关文件的最短距离,然后去发给gpt解答,效果还不错,在这么复杂的RL论文上测试我很满意,而且是原生中文提问英文文档的内容。后面调整超参,加入bm25,甚至graph的结果,在rerank,再换很好的模型来生成问题,比如o1,效果能更好
RAG 不准就自己用faiss从头写一个...RAG 不准就自己用faiss从头写一个...RAG 不准就自己用faiss从头写一个...RAG 不准就自己用faiss从头写一个...RAG 不准就自己用faiss从头写一个...RAG 不准就自己用faiss从头写一个...RAG 不准就自己用faiss从头写一个...RAG 不准就自己用faiss从头写一个...RAG 不准就自己用faiss从头写一个...