大语言模型

[1.1k星]《Build a Large Language Model (From Scratch)》的中文版电子书，助力更多中文读者掌握大模型技术。亮点：1. 从零开始构建模型，涵盖从基础架构到高

【[1.1k星]《Build a Large Language Model (From Scratch)》的中文版电子书，助力更多中文读者掌握大模型技术。亮点：1. 从零开始构

2025-05-15 浏览详情

[73星]Awesome-Efficient-Reasoning-LLMs：高效推理大语言模型的宝藏指南。亮点：1. 首个系统性调研高效推理在LLMs中的进展；2. 涵盖70+篇前沿研究论文，按方向分

【[73星]Awesome-Efficient-Reasoning-LLMs：高效推理大语言模型的宝藏指南。亮点：1. 首个系统性调研高效推理在LLMs中的进展；2. 涵盖

2025-03-26 浏览详情

大语言模型推理能力的现状与前沿进展。亮点：1. 汇总了2025年推理模型的最新研究成果；2. 详细解读了推理时计算扩展方法；3. 涵盖了12篇关键论文，涵盖从简单到复杂的推理优化技术

【大语言模型推理能力的现状与前沿进展。亮点：1. 汇总了2025年推理模型的最新研究成果；2. 详细解读了推理时计算扩展方法；3. 涵盖了1

2025-03-11 浏览详情

[323星]LLMs-from-scratch-CN：从零构建大模型的中文翻译项目，助力中文学习者深入理解大语言模型的构建与实践。亮点：1. 详细中文注释的Jupyter代码，快速上手；2. 提供丰富

【[323星]LLMs-from-scratch-CN：从零构建大模型的中文翻译项目，助力中文学习者深入理解大语言模型的构建与实践。亮点：1. 详细中文注

2025-03-02 浏览详情

[112星]mini_qwen：从零开始打造你的专属大语言模型！只需12G显存，就能在T4显卡上开启训练之旅。亮点：1. 1B参数，支持中英文，满足多样化需求；2. 预训练、微调、直接偏好优化三步走，

【[112星]mini_qwen：从零开始打造你的专属大语言模型！只需12G显存，就能在T4显卡上开启训练之旅。亮点：1. 1B参数，支持中英文，满足多样化

2025-01-31 浏览详情

lite_llama：轻量级推理框架，专为大型语言模型优化，提供高达3.4倍的加速比，支持最新模型和流式输出

【lite_llama：轻量级推理框架，专为大型语言模型优化，提供高达3.4倍的加速比，支持最新模型和流式输出】'The llama model inference li

2024-12-24 浏览详情

使用了大语言模型的 AI...

使用了大语言模型的 AI 应用其实更需要建立较广泛的自动化回归测试集。因为大模型本身有相当的随机性和不确定性，即使把温度设为 0

2024-12-22 浏览详情

Florence-VL: Enhancing...

Florence-VL: Enhancing Vision-Language Models with Generative Vision Encoder and Depth-Breadth Fusion模型训练大语言模型

2024-12-16 浏览详情

llama-chunk：一个基于Llama-70B的创新文本分块策略，针对RAG应用优化。其特色是使用中文字符"段"作为特殊标记，让大模型自动进行语义分块，无需使用正则表达式或人工

【llama-chunk：一个基于Llama-70B的创新文本分块策略，针对RAG应用优化。其特色是使用中文字符"段"作为特殊标记，让大模型自动进行语

2024-12-09 浏览详情

视觉语言模型

VisGraphVar: A Benchmark Generator for Assessing Variability in Graph Analysis Using Large Vision-Language Models大语言

2024-12-08 浏览详情

MasteringRAG：一个全面的企业级RAG系统教程项目，涵盖从入门到精通的完整知识体系。包括文档问答、检索优化、评估方法、Agent实现等多个模块，提供详细的实践示例和优化方案，帮助开发者构建高

【MasteringRAG：一个全面的企业级RAG系统教程项目，涵盖从入门到精通的完整知识体系。包括文档问答、检索优化、评估方法、Agent实现

2024-12-05 浏览详情

预训练语言模型

MARVEL-40M+: Multi-Level Visual Elaboration for High-Fidelity Text-to-3D Content Creation预训练语言模型3D大语言模型每日A

2024-12-04 浏览详情

Marco-o1：开源大型推理模型，专注于解决现实世界的开放性问题。基于Qwen2-7B-Instruct模型，集成了Chain-of-Thought微调、蒙特卡洛树搜索(MCTS)和反思机制。在MG

【Marco-o1：开源大型推理模型，专注于解决现实世界的开放性问题。基于Qwen2-7B-Instruct模型，集成了Chain-of-Thought微调、蒙特卡洛

2024-11-29 浏览详情

星辰语义大模型TeleChat2：国产自研的千亿参数大语言模型，擅长中英文对话，提升问答、写作和计算能力

【星辰语义大模型TeleChat2：国产自研的千亿参数大语言模型，擅长中英文对话，提升问答、写作和计算能力】'TeleChat2 - The first comp

2024-10-03 浏览详情

Mini-LLaVA：一款轻量级的多模态大语言模型，能处理图像、文本和视频输入，实现高效且灵活的多模态数据处理

【Mini-LLaVA：一款轻量级的多模态大语言模型，能处理图像、文本和视频输入，实现高效且灵活的多模态数据处理】'Mini-LLaVA - A minima

2024-09-28 浏览详情

PresentationGen：利用大语言模型生成PPT文件的SpringBoot Web应用，主要功能是自动化创建演示文稿，适用于快速制作演示材料，特色在于其高效的模板处理和文本替换技术

【PresentationGen：利用大语言模型生成PPT文件的SpringBoot Web应用，主要功能是自动化创建演示文稿，适用于快速制作演示材料，特色在于

2024-09-19 浏览详情

Awesome LLMs on Device：全面调查在设备端大语言模型（LLM），是研究者、开发者和学习者了解、利用和贡献于在设备端部署的LLM的终极资源库

【Awesome LLMs on Device：全面调查在设备端大语言模型（LLM），是研究者、开发者和学习者了解、利用和贡献于在设备端部署的LLM的终极资

2024-09-09 浏览详情

LLM-zero2hero：高度解耦的大语言模型微调项目，支持自定义训练、验证和推理过程，实现全量微调和LoRA微调

【LLM-zero2hero：高度解耦的大语言模型微调项目，支持自定义训练、验证和推理过程，实现全量微调和LoRA微调】'LLM-zero2hero - 高度可

2024-08-28 浏览详情

研究人员打造统一型参考框架，阐述构建大模型游戏智能体的基本模块

【研究人员打造统一型参考框架，阐述构建大模型游戏智能体的基本模块】

以 ChatGPT 为代表的大语言模型，展现出“类人”的文本理解

2024-08-17 浏览详情

正在拼命加载中

我是有底线的

没有更多的页面可以加载啦！