Llama Family 概述
Llama Family 是一个专为开发者和Llama模型爱好者打造的社区。Llama模型是一系列用于自然语言和代码生成的大规模人工智能模型。在这个社区中,成员们可以学习到关于不同版本的Llama模型、它们的训练数据、参数以及所使用的计算平台等知识。
Llama模型的版本信息
Llama模型有多个不同的版本,每个版本都有其特定的功能和性能指标。这些版本包括基础版、增强版以及专业版等。用户可以根据自己的需求选择合适的版本进行学习和应用。
训练数据和参数
Llama模型的训练数据来源于广泛的文本资料,包括书籍、文章、网页等内容。通过这些数据,模型学习到了丰富的语言知识,从而能够进行有效的自然语言处理任务。此外,模型的参数也是影响其性能的关键因素之一,用户可以通过调整参数来优化模型的表现。
计算平台
由于Llama模型的规模较大,因此需要在高性能的计算平台上进行训练和运行。这些计算平台通常具有强大的GPU和CPU资源,能够有效处理大规模的数据并执行复杂的计算。用户可以根据自己的需求选择合适的硬件设备来支持Llama模型的运行。
社区活动
Llama Family 社区定期举办各类活动,如线上研讨会、线下交流会等,旨在促进成员之间的交流和技术分享。通过这些活动,成员们可以加深对Llama模型的理解,提高自己的技能水平,并与其他开发者建立联系。
LLaMA 3的官方模型:
Llama3官方模型
类别 | 模型名称 | 🤗模型加载名称 | 下载地址 |
---|---|---|---|
预训练 | Llama3-8B | meta-llama/Meta-Llama-3-8B | HuggingFace | 百度网盘 |
预训练 | Llama3-70B | meta-llama/Meta-Llama-3-70B | HuggingFace | 百度网盘 |
对话模型 | Llama3-8B-Chat | meta-llama/Meta-Llama-3-8B-Instruct | HuggingFace | 百度网盘 |
对话模型 | Llama3-70B-Chat | meta-llama/Meta-Llama-3-70B-Instruct | HuggingFace | 百度网盘 |
Llama3中文微调模型
类别 | 模型名称 | 🤗模型加载名称 | 下载地址 |
---|---|---|---|
对话模型 | Llama3-Chinese-8B-Instruct | FlagAlpha/Llama3-Chinese-8B-Instruct | HuggingFace | modelscope | wisemodel |
Llama2官方模型
类别 | 模型名称 | 🤗模型加载名称 | 下载地址 |
---|---|---|---|
预训练 | Llama2-7B | meta-llama/Llama-2-7b-hf | HuggingFace | 迅雷网盘 |
预训练 | Llama2-13B | meta-llama/Llama-2-13b-hf | HuggingFace | 迅雷网盘 |
预训练 | Llama2-70B | meta-llama/Llama-2-70b-hf | HuggingFace |
Chat | Llama2-7B-Chat | meta-llama/Llama-2-7b-chat-hf | HuggingFace | 迅雷网盘 |
Chat | Llama2-13B-Chat | meta-llama/Llama-2-13b-chat-hf | HuggingFace | 迅雷网盘 |
Chat | Llama2-70B-Chat | meta-llama/Llama-2-70b-chat-hf | HuggingFace | 迅雷网盘 |
Code | CodeLlama-7b | meta-llama/Llama-2-70b-chat-hf | 迅雷网盘 |
Code | CodeLlama-7b-Python | meta-llama/Llama-2-70b-chat-hf | 迅雷网盘 |
Code | CodeLlama-7b-Instruct | meta-llama/Llama-2-70b-chat-hf | 迅雷网盘 |
Code | CodeLlama-13b | meta-llama/Llama-2-70b-chat-hf | 迅雷网盘 |
Code | CodeLlama-13b-Python | meta-llama/Llama-2-70b-chat-hf | 迅雷网盘 |
Code | CodeLlama-13b-Instruct | meta-llama/Llama-2-70b-chat-hf | 迅雷网盘 |
Code | CodeLlama-34b | meta-llama/Llama-2-70b-chat-hf | 迅雷网盘 |
Meta官方在2023年8月24日发布了Code Llama,基于代码数据对Llama2进行了微调,提供三个不同功能的版本:基础模型(Code Llama)、Python专用模型(Code Llama – Python)和指令跟随模型(Code Llama – Instruct),包含7B、13B、34B三种不同参数规模。不同模型能力区别如下表所示:
模型类别 | 模型名称 | 代码续写 | 代码填充 | 指令编程 |
---|---|---|---|---|
Code Llama | CodeLlama-7b | ✅ | ✅ | ❌ |
CodeLlama-13b | ✅ | ✅ | ❌ | |
CodeLlama-34b | ✅ | ❌ | ❌ | |
Code Llama – Python | CodeLlama-7b-Python | ✅ | ❌ | ❌ |
CodeLlama-13b-Python | ✅ | ❌ | ❌ | |
CodeLlama-34b-Python | ✅ | ❌ | ❌ | |
Code Llama – Instruct | CodeLlama-7b-Instruct | ❌ | ✅ | ✅ |
CodeLlama-13b-Instruct | ❌ | ✅ | ✅ | |
CodeLlama-34b-Instruct | ❌ | ❌ | ✅ |
关于Code Llama的详细信息可以参考官方Github仓库codellama。
Llama2中文微调模型
我们基于中文指令数据集对Llama2-Chat模型进行了微调,使得Llama2模型有着更强的中文对话能力。LoRA参数以及与基础模型合并的参数均已上传至Hugging Face,目前包含7B和13B的模型。
类别 | 模型名称 | 🤗模型加载名称 | 基础模型版本 | 下载地址 |
---|---|---|---|---|
合并参数 | Llama2-Chinese-7b-Chat | FlagAlpha/Llama2-Chinese-7b-Chat | meta-llama/Llama-2-7b-chat-hf | HuggingFace |
合并参数 | Llama2-Chinese-13b-Chat | FlagAlpha/Llama2-Chinese-13b-Chat | meta-llama/Llama-2-13b-chat-hf | HuggingFace |
LoRA参数 | Llama2-Chinese-7b-Chat-LoRA | FlagAlpha/Llama2-Chinese-7b-Chat-LoRA | meta-llama/Llama-2-7b-chat-hf | HuggingFace |
LoRA参数 | Llama2-Chinese-13b-Chat-LoRA | FlagAlpha/Llama2-Chinese-13b-Chat-LoRA | meta-llama/Llama-2-13b-chat-hf | HuggingFace |