模型名称 | MOE 架构 | 参数大小 | 激活参数大小 | 上下文长度 | 公司名称 | 发布时间 |
---|---|---|---|---|---|---|
Llama4-maverick | 是 | 402B | 17B | 1M | Meta | 2025-04-06 |
Llama4-scout | 是 | 109B | 17B | 10M | Meta | 2025-04-06 |
Deepseek-R1 | 是 | 671B | 37B | 128K | Deepseek | 2025-01-20 |
Deepseek-V3 | 是 | 671B | 37B | 128K | Deepseek | 2025-01-20 |
Qwen2.5 | 否 | 0.5B-72B | - | 128K | 阿里巴巴 | 2024-09-19 |
Deepseek-v2.5 | 是 | 236B | 21B | 128K | DeepSeek | 2024-09-06 |
Mistral-Large2 | 否 | 123B | - | 128K | Mistral | 2024-07-24 |
Llama3.1 | 否 | 7B 70B 405B | - | 128K | Meta | 2024-07-23 |
Mistral-nemo | 否 | 12B | - | 128K | Mistral | 2024-07-19 |
Gemma2 | 否 | 9B 27B | - | 8K | 2024-06-27 | |
Qwen2 | 否 | 0.5B 1.5B 7B 72B | - | 32K 128K | 阿里巴巴 | 2024-06-15 |
GLM-4 | 否 | 9B | - | 128K 1M | 智谱 AI | 2024-06-05 |
Codestral | 否 | 22B | - | 32K | Mistral | 2024-05-30 |
Yuan2.0-M32 | 是 | 40B | 3.7B | 16K | 浪潮信息 | 2024-05-30 |
Phi3-medium | 否 | 14B | - | 4K 128K | Microsoft | 2024-05-21 |
Yi-1.5 | 否 | 6B 9B 34B | - | 4K | 零一万物 | 2024-05-13 |
Deepseek-v2 | 是 | 236B | 21B | 128K | DeepSeek | 2024-05-06 |
Phi3-mini | 否 | 3.8B | - | 4K 128K | Microsoft | 2024-04-23 |
Llama3 | 否 | 8B 70B | - | 8K | Meta | 2024-04-18 |
WizardLM2 | 是 | 7B 8X22B 70B | 39B | 65K | Microsoft | 2024-04-15 |
Mixtral 8*22B | 是 | 8X22B | 39B | 65K | Mistral | 2024-04-10 |
Gemma1.1 | 否 | 2B 7B | - | 8K | 2023-04-10 | |
Qwen1.5-32B | 否 | 32B | - | 32K | 阿里巴巴 | 2024-04-05 |
Command-R plus | 否 | 104B | - | 128K | Cohere | 2024-04-04 |
DBRX-instruct | 是 | 132B | 36B | 32K | Databricks | 2024-03-27 |
Grok-1 | 是 | 314B | 86B | 8K | X ai | 2024-03-17 |
Command-R | 否 | 35B | - | 128K | Cohere | 2024-03-11 |
Gemma | 否 | 2B 7B | - | 8K | 2023-02-21 | |
Qwen1.5 | 否 | 0.5B-72B | - | 32K | 阿里巴巴 | 2024-02-04 |
LLama2 | 否 | 7B-70B | - | 4K | Meta | 2023-07-16 |
nuxt3上实现动态配置反向代理的方法
发表于
本文字数: 1.5k 阅读时长 ≈ 1 分钟
本文字数: 1.5k 阅读时长 ≈ 1 分钟
各种国外源下载慢解决方法
发表于
本文字数: 723 阅读时长 ≈ 1 分钟
本文字数: 723 阅读时长 ≈ 1 分钟
背景
由于众所周知的原因导致国内开发者下载慢甚至无法下载某些开发工具,从而导致开发效率极其低下。一种解决办法就是科学上网,但是不是所有人都能找到途径,还有一种办法就是修改为国内镜像源等方式解决这个问题。
LLM工具大全
发表于
本文字数: 826 阅读时长 ≈ 1 分钟
本文字数: 826 阅读时长 ≈ 1 分钟
背景
2023年是开源LLM爆发的一年,不仅包含非常多优秀的开源模型,还有大量结合LLM开发智能应用的工具,这篇文章主要整理相关内容,包括但不限于以下:
- 本地LLM部署
- LLM+RAG 工具
- Agent工具
leetcode题解149:直线上最多的点数
leetcode题解148:排序链表
leetcode题解147:对链表进行插入排序
leetcode题解146:LRU缓存
leetcode题解143:重排链表
软件项目整理
个人的一些开发项目,更新截止日期2023-10-28。
引言
这篇博客,主要是记录自己在技术方面的学习过程和学习成果,微不足道但回忆起来也不失意味。算是勉励自己,要保持终身学习,无论是为了工作还或是兴趣,吾之生而有涯而知无涯。忙碌的生活总是容易让人忘记最初的追求,感觉自己已经很久没有静下心来写点什么——所思,所得,所感。最终趁着生活的一个间隙,决定寻觅下自己在技术方面的留下来的足迹,这也是这篇博客的由来。