记录团队成长点滴以及对技术、理念的探索,同时我们乐于分享!

3523
qwen3-0.6B这种小模型有什么实际意义和用途吗?

2025-06-17 查看(1000)

0.5b 这种才是最有用的,因为它可以万能地微调成单一小任务
3523
玉米粒为什么靠近根部排列比较乱,而越靠近尖端排列越整齐?

2025-06-17 查看(1000)

这个问题问到了我的心趴上,小时候我在吃玉米时也发现有的玉米出
3523
如何评价MiniMax推出的全球首个开源大规模混合架构的推理模型MiniMax-M1,其有何技术优势?

2025-06-17 查看(1000)

虽说如今新大模型发布必须有点拿得出手的干货,但MiniMax
3523
JetBrains 放弃 AppCode 是否是一个错误决定?

2025-06-18 查看(1000)

不算错误。 没人会用AppCode写objc和swift的
3523
以色列是如何从三天前的不可一世要灭了伊朗到今天的哭哭啼啼要“为生存而战”的?

2025-06-18 查看(1000)

题主是不是,呃,不太喜欢看历史......... 没事,不研
3523
双胞胎为什么要穿得一模一样,目的何在?

2025-06-18 查看(1000)

有那么多人收藏,都是想生二胎的吗? 我们家双胞胎,从小所有玩