0%

模型名称 MOE 架构 参数大小 激活参数大小 上下文长度 公司名称 发布时间
Llama4-maverick 402B 17B 1M Meta 2025-04-06
Llama4-scout 109B 17B 10M Meta 2025-04-06
Deepseek-R1 671B 37B 128K Deepseek 2025-01-20
Deepseek-V3 671B 37B 128K Deepseek 2025-01-20
Qwen2.5 0.5B-72B - 128K 阿里巴巴 2024-09-19
Deepseek-v2.5 236B 21B 128K DeepSeek 2024-09-06
Mistral-Large2 123B - 128K Mistral 2024-07-24
Llama3.1 7B 70B 405B - 128K Meta 2024-07-23
Mistral-nemo 12B - 128K Mistral 2024-07-19
Gemma2 9B 27B - 8K Google 2024-06-27
Qwen2 0.5B 1.5B 7B 72B - 32K 128K 阿里巴巴 2024-06-15
GLM-4 9B - 128K 1M 智谱 AI 2024-06-05
Codestral 22B - 32K Mistral 2024-05-30
Yuan2.0-M32 40B 3.7B 16K 浪潮信息 2024-05-30
Phi3-medium 14B - 4K 128K Microsoft 2024-05-21
Yi-1.5 6B 9B 34B - 4K 零一万物 2024-05-13
Deepseek-v2 236B 21B 128K DeepSeek 2024-05-06
Phi3-mini 3.8B - 4K 128K Microsoft 2024-04-23
Llama3 8B 70B - 8K Meta 2024-04-18
WizardLM2 7B 8X22B 70B 39B 65K Microsoft 2024-04-15
Mixtral 8*22B 8X22B 39B 65K Mistral 2024-04-10
Gemma1.1 2B 7B - 8K Google 2023-04-10
Qwen1.5-32B 32B - 32K 阿里巴巴 2024-04-05
Command-R plus 104B - 128K Cohere 2024-04-04
DBRX-instruct 132B 36B 32K Databricks 2024-03-27
Grok-1 314B 86B 8K X ai 2024-03-17
Command-R 35B - 128K Cohere 2024-03-11
Gemma 2B 7B - 8K Google 2023-02-21
Qwen1.5 0.5B-72B - 32K 阿里巴巴 2024-02-04
LLama2 7B-70B - 4K Meta 2023-07-16

场景

实现一个本地LLM前端Chat界面,使用Ollama部署本地LLM。基本功能:在前端设置模型的服务地址如http://localhost:11434,由于浏览器存在跨域问题,所以必须采用一些方法来解决该问题。

阅读全文 »

背景

由于众所周知的原因导致国内开发者下载慢甚至无法下载某些开发工具,从而导致开发效率极其低下。一种解决办法就是科学上网,但是不是所有人都能找到途径,还有一种办法就是修改为国内镜像源等方式解决这个问题。

阅读全文 »

背景

2023年是开源LLM爆发的一年,不仅包含非常多优秀的开源模型,还有大量结合LLM开发智能应用的工具,这篇文章主要整理相关内容,包括但不限于以下:

  • 本地LLM部署
  • LLM+RAG 工具
  • Agent工具
阅读全文 »

个人的一些开发项目,更新截止日期2023-10-28。

引言

这篇博客,主要是记录自己在技术方面的学习过程和学习成果,微不足道但回忆起来也不失意味。算是勉励自己,要保持终身学习,无论是为了工作还或是兴趣,吾之生而有涯而知无涯。忙碌的生活总是容易让人忘记最初的追求,感觉自己已经很久没有静下心来写点什么——所思,所得,所感。最终趁着生活的一个间隙,决定寻觅下自己在技术方面的留下来的足迹,这也是这篇博客的由来。

阅读全文 »