当前位置: 首页 >
如何评价面壁新发布的端侧模型 MiniCPM-4,该模型有哪些技术亮点?_上海市崇明区阳召差灯具股份公司
文章出处:网络 人气:发表时间:2025-06-24 19:25:16
最近几年精力有限比较少在知乎上回答问题了,不过每次看到精彩的问题和回答还是会手痒。
趁这次MiniCPM-4模型发布,集中分享下最近一年多来的感悟和想法,也是最近跟同学朋友经常探讨的话题,抛砖引玉一起交流。
为什么做端侧模型 规模法则可持续发展问题。
大模型在规模法则(Scaling Law)的指引下,参数规模从2018年的千万量级发展到2024年的千亿量级(Llama3.1-405B)。
到了2024年下半年,逐渐出现规模法则是否可持续的大讨论…。
同类文章排行
- LCD党真的只是少部分人吗?
- jwt的设计合理吗?
- 请问照片里这个人是谁呀?
- 为什么有的人喜欢盲目抵制 goto 语法?
- 有一张巨强的显卡是什么体验?
- 如果不能使用linux,只能选鸿蒙与windows,你会选哪个?
- 长期使用的大佬来说说,MacOS 真的比 Windows 稳定吗?
- jwt的设计合理吗?
- Flutter集成rust到底有多好?
- 如何评价威海这个城市?
最新资讯文章
- arm在低功耗下的效率是x86的两倍以上,为何掌机还不使用arm芯片?
- 求推荐程序开发笔记本!?
- 你的择偶标准是怎么样的?
- 1MB其实是一个很大的存储单位,那么它的存储容量究竟有多大?
- 单台电脑如何让数据库吃满硬盘速度?
- 老板难道真的看不到公司谁在拼命工作,谁在摸鱼嘛?
- 女生到底应不应该穿***的衣服?
- 为什么 Golang 不适合开发桌面系统?
- 阿里云盘冻结后强制收费才能解冻,如何处理?
- 为什么4k电视剧一集也就4g,但却跟4k原盘电影100g看起来差不多清晰?
- MiniMax Week第三天推出通用 Agent,体验如何?对行业会带来哪些影响?
- 为什么那么多人用GO?GO语言的优势在哪里?
- 为什么在日本是实体店干掉电商,在中国却是电商干掉实体?
- 锻炼腰肌的经典动作有哪些?
- 为什么现在吹Rust的人这么多?
- 什么是 AI Agent(智能体)?
- 为什么这么多人讨厌中国移动?
- 有什么关于贵阳的冷知识?
- 为什么国内程序员们没有联合起来设计一种中英文严格2:1宽度比的字体呢?
- J***aScript 已经强大到什么程度了?