RAG 不准就自己用faiss从头写一个...

Transformer-周
2024-11-24 07:10:31

RAG 不准就自己用faiss从头写一个，逻辑是一个标准的工程化思路，我以前就说过，问题的L2距离和所谓答案的L2距离相比一定是与类似问题的L2更接近。所以再切chunk之后先让gpt4o mini去针对每个chunk提3个问题,然后把问题向量化，再做一个相关的文档与这个问题的链表，这样新问题来了就可以匹配问题的L2距离，一定比文档的L2距离更近，为了防止llm没提供足够的问题，我又加了文档的L2距离，可以同时匹配6个相关文件的最短距离，然后去发给gpt解答，效果还不错，在这么复杂的RL论文上测试我很满意，而且是原生中文提问英文文档的内容。后面调整超参，加入bm25，甚至graph的结果，在rerank,再换很好的模型来生成问题，比如o1,效果能更好