[73星]Awesome-Efficient-Reasoning-LLMs:高效推理大语言模型的宝藏指南。亮点:1. 首个系统性调研高效推理在LLMs中的进展;2. 涵盖70+篇前沿研究论文,按方向分

[73星]Awesome-Efficient-Reasoning-LLMs:高效推理大语言模型的宝藏指南。亮点:1. 首个系统性调研高效推理在LLMs中的进展;2. 涵盖70+篇前沿研究论文,按方向分

【[73星]Awesome-Efficient-Reasoning-LLMs:高效推理大语言模型的宝藏指南。亮点:1. 首个系统性调研高效推理在LLMs中的进展;2. 涵盖

2025-03-26浏览详情

大语言模型推理能力的现状与前沿进展。亮点:1. 汇总了2025年推理模型的最新研究成果;2. 详细解读了推理时计算扩展方法;3. 涵盖了12篇关键论文,涵盖从简单到复杂的推理优化技术

大语言模型推理能力的现状与前沿进展。亮点:1. 汇总了2025年推理模型的最新研究成果;2. 详细解读了推理时计算扩展方法;3. 涵盖了12篇关键论文,涵盖从简单到复杂的推理优化技术

【大语言模型推理能力的现状与前沿进展。亮点:1. 汇总了2025年推理模型的最新研究成果;2. 详细解读了推理时计算扩展方法;3. 涵盖了1

2025-03-11浏览详情

[323星]LLMs-from-scratch-CN:从零构建大模型的中文翻译项目,助力中文学习者深入理解大语言模型的构建与实践。亮点:1. 详细中文注释的Jupyter代码,快速上手;2. 提供丰富

[323星]LLMs-from-scratch-CN:从零构建大模型的中文翻译项目,助力中文学习者深入理解大语言模型的构建与实践。亮点:1. 详细中文注释的Jupyter代码,快速上手;2. 提供丰富

【[323星]LLMs-from-scratch-CN:从零构建大模型的中文翻译项目,助力中文学习者深入理解大语言模型的构建与实践。亮点:1. 详细中文注

2025-03-02浏览详情

[112星]mini_qwen:从零开始打造你的专属大语言模型!只需12G显存,就能在T4显卡上开启训练之旅。亮点:1. 1B参数,支持中英文,满足多样化需求;2. 预训练、微调、直接偏好优化三步走,

[112星]mini_qwen:从零开始打造你的专属大语言模型!只需12G显存,就能在T4显卡上开启训练之旅。亮点:1. 1B参数,支持中英文,满足多样化需求;2. 预训练、微调、直接偏好优化三步走,

【[112星]mini_qwen:从零开始打造你的专属大语言模型!只需12G显存,就能在T4显卡上开启训练之旅。亮点:1. 1B参数,支持中英文,满足多样化

2025-01-31浏览详情

lite_llama:轻量级推理框架,专为大型语言模型优化,提供高达3.4倍的加速比,支持最新模型和流式输出

lite_llama:轻量级推理框架,专为大型语言模型优化,提供高达3.4倍的加速比,支持最新模型和流式输出

【lite_llama:轻量级推理框架,专为大型语言模型优化,提供高达3.4倍的加速比,支持最新模型和流式输出】'The llama model inference li

2024-12-24浏览详情

使用了大语言模型的 AI...

使用了大语言模型的 AI...

使用了大语言模型的 AI 应用其实更需要建立较广泛的自动化回归测试集。因为大模型本身有相当的随机性和不确定性,即使把温度设为 0

2024-12-22浏览详情

Florence-VL: Enhancing...

Florence-VL: Enhancing...

Florence-VL: Enhancing Vision-Language Models with Generative Vision Encoder and Depth-Breadth Fusion模型训练大语言模型

2024-12-16浏览详情

llama-chunk:一个基于Llama-70B的创新文本分块策略,针对RAG应用优化。其特色是使用中文字符"段"作为特殊标记,让大模型自动进行语义分块,无需使用正则表达式或人工

llama-chunk:一个基于Llama-70B的创新文本分块策略,针对RAG应用优化。其特色是使用中文字符"段"作为特殊标记,让大模型自动进行语义分块,无需使用正则表达式或人工

【llama-chunk:一个基于Llama-70B的创新文本分块策略,针对RAG应用优化。其特色是使用中文字符"段"作为特殊标记,让大模型自动进行语

2024-12-09浏览详情

视觉语言模型

视觉语言模型

VisGraphVar: A Benchmark Generator for Assessing Variability in Graph Analysis Using Large Vision-Language Models大语言

2024-12-08浏览详情

MasteringRAG:一个全面的企业级RAG系统教程项目,涵盖从入门到精通的完整知识体系。包括文档问答、检索优化、评估方法、Agent实现等多个模块,提供详细的实践示例和优化方案,帮助开发者构建高

MasteringRAG:一个全面的企业级RAG系统教程项目,涵盖从入门到精通的完整知识体系。包括文档问答、检索优化、评估方法、Agent实现等多个模块,提供详细的实践示例和优化方案,帮助开发者构建高

【MasteringRAG:一个全面的企业级RAG系统教程项目,涵盖从入门到精通的完整知识体系。包括文档问答、检索优化、评估方法、Agent实现

2024-12-05浏览详情

预训练语言模型

预训练语言模型

MARVEL-40M+: Multi-Level Visual Elaboration for High-Fidelity Text-to-3D Content Creation预训练语言模型3D大语言模型每日A

2024-12-04浏览详情

Marco-o1:开源大型推理模型,专注于解决现实世界的开放性问题。基于Qwen2-7B-Instruct模型,集成了Chain-of-Thought微调、蒙特卡洛树搜索(MCTS)和反思机制。在MG

Marco-o1:开源大型推理模型,专注于解决现实世界的开放性问题。基于Qwen2-7B-Instruct模型,集成了Chain-of-Thought微调、蒙特卡洛树搜索(MCTS)和反思机制。在MG

【Marco-o1:开源大型推理模型,专注于解决现实世界的开放性问题。基于Qwen2-7B-Instruct模型,集成了Chain-of-Thought微调、蒙特卡洛

2024-11-29浏览详情

星辰语义大模型TeleChat2:国产自研的千亿参数大语言模型,擅长中英文对话,提升问答、写作和计算能力

星辰语义大模型TeleChat2:国产自研的千亿参数大语言模型,擅长中英文对话,提升问答、写作和计算能力

【星辰语义大模型TeleChat2:国产自研的千亿参数大语言模型,擅长中英文对话,提升问答、写作和计算能力】'TeleChat2 - The first comp

2024-10-03浏览详情

Mini-LLaVA:一款轻量级的多模态大语言模型,能处理图像、文本和视频输入,实现高效且灵活的多模态数据处理

Mini-LLaVA:一款轻量级的多模态大语言模型,能处理图像、文本和视频输入,实现高效且灵活的多模态数据处理

【Mini-LLaVA:一款轻量级的多模态大语言模型,能处理图像、文本和视频输入,实现高效且灵活的多模态数据处理】'Mini-LLaVA - A minima

2024-09-28浏览详情

PresentationGen:利用大语言模型生成PPT文件的SpringBoot Web应用,主要功能是自动化创建演示文稿,适用于快速制作演示材料,特色在于其高效的模板处理和文本替换技术

PresentationGen:利用大语言模型生成PPT文件的SpringBoot Web应用,主要功能是自动化创建演示文稿,适用于快速制作演示材料,特色在于其高效的模板处理和文本替换技术

【PresentationGen:利用大语言模型生成PPT文件的SpringBoot Web应用,主要功能是自动化创建演示文稿,适用于快速制作演示材料,特色在于

2024-09-19浏览详情

Awesome LLMs on Device:全面调查在设备端大语言模型(LLM),是研究者、开发者和学习者了解、利用和贡献于在设备端部署的LLM的终极资源库

Awesome LLMs on Device:全面调查在设备端大语言模型(LLM),是研究者、开发者和学习者了解、利用和贡献于在设备端部署的LLM的终极资源库

【Awesome LLMs on Device:全面调查在设备端大语言模型(LLM),是研究者、开发者和学习者了解、利用和贡献于在设备端部署的LLM的终极资

2024-09-09浏览详情

LLM-zero2hero:高度解耦的大语言模型微调项目,支持自定义训练、验证和推理过程,实现全量微调和LoRA微调

LLM-zero2hero:高度解耦的大语言模型微调项目,支持自定义训练、验证和推理过程,实现全量微调和LoRA微调

【LLM-zero2hero:高度解耦的大语言模型微调项目,支持自定义训练、验证和推理过程,实现全量微调和LoRA微调】'LLM-zero2hero - 高度可

2024-08-28浏览详情

研究人员打造统一型参考框架,阐述构建大模型游戏智能体的基本模块

研究人员打造统一型参考框架,阐述构建大模型游戏智能体的基本模块

【研究人员打造统一型参考框架,阐述构建大模型游戏智能体的基本模块】

以 ChatGPT 为代表的大语言模型,展现出“类人”的文本理解

2024-08-17浏览详情

正在拼命加载中

我是有底线的

没有更多的页面可以加载啦!