记录团队成长点滴以及对技术、理念的探索,同时我们乐于分享!

3523
qwen3-0.6B这种小模型有什么实际意义和用途吗?

2025-06-17 查看(1000)

0.5b 这种才是最有用的,因为它可以万能地微调成单一小任务
3523
如何评价Google刚刚发布的 Gemini Diffusion? 会代替自回归模型成为下一代模型吗?

2025-06-17 查看(1000)

首先谷歌的 llm diffusion 和之前发布的 llm
3523
你身边身材最好的女生是什么样?

2025-06-17 查看(1000)

去游泳的时候见过一个,165左右,小头宽肩细腰胯宽腿直肤白,
3523
rust中的pin是不是一个失败的设计?

2025-06-18 查看(1000)

不是。 太长不看版:“是否可以移动”应该是位置的特性,而不
3523
黄磊做菜的水平怎么样?

2025-06-17 查看(1000)

《深夜食堂》片尾都有菜谱,有一个我真的跟着黄磊做了—— 满葱
3523
如何看待 Rust 写的 PNG 解码器比 C 实现更快?

2025-06-18 查看(1000)

现在的“快”跟二十年前的“快”已经不是一个概念了。 “无畏并